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Prefácio da quarta edição 


А quarta edição foi planejada para oferecer uma introdução a estruturas de dados e algoritmos, 
incluindo projeto, análise e implementação. Considerando os currículos baseados no Currículo 
de Ciência de Computação IEEE/ACM 2001, este livro é apropriado para uso nos cursos CS 102 
(versões ПОВ), 05103 (versões POB) CSI 1 liverio Aje 05112 (versões A/IO/F/H). Sua 
utilização nestas disciplinas é discutida detalhadamente neste prefácio. 

As maiores alterações, em relação à terceira edição, são as que seguem: 


= è ë 


Um capítulo novo sobre arranjos, listas encadeadas e recursão 

Um capítulo novo sobre gerência de memória 

Integração total com o Java 5.0 

Melhor integração com o Framework de Coleções de Java 

Melhor cobertura de iteradores 

Aumento da cobertura de listas baseadas em vetores, incluindo a substituição do uso da 
classe Java util. vector por Java util. Array Last 

Atualização de todas as APIs de Java para o uso de tipos genéricos 

simplificação dos tipos abstratos de dados lista, árvore binária e lista com prioridades 
Redução dos conceitos matemáticos para as sete funções mais usadas 

Exercícios expandidos e revisados, elevando o total de exercícios de reforço, criatividade 
e projetos para 670, Os exercícios acrescentados incluem novos projetos sobre a ma- 
nutenção da lista de maiores escores de um jogo, avaliação pós-fixada e interfixada de 
expressões, avaliação de árvores minimax de jogos, processamento de ordens de compra 
e venda de ações, escalonamento de tarefas em uma CPU, simulagäo n-hody, computação 
do tamanho de cadeias de DNA e criação e solução de labirintos. 


Este livro está relacionado com as seguintes obras: 


М.Т. Goodrich, R. Tamassia, and D.M. Mount, Data Structures and Algorithms in C++. 
John Wiley & Sons, Inc., 2004, Este livro tem uma estrutura geral similar à presente obra, 
mas usa C++ como linguagem base (com algumas diferenças pedagógicas modestas, mas 
necessárias, requeridas por esta abordagem). Assim, podem ser usados em conjunto em 
um currículo que admite tanto Java como C++ em suas disciplinas introdutórias. 

М.Т. Goodrich and Е. Tamassia, Algorithm Design: Foundations, Analvsis, amd Internet 
Exariples*, John Wiley & Sons, Inc., 2002. È um livro-texto para uma disciplina mais 
avançada em estruturas de dados e algoritmos, tal como a 05210 (versões T/W/C/S) do 


curriculo IEEEA/ACM 2001. 


Uso como livro-texto 


O projeto e a análise de estruturas de dados eficientes for há muito reconhecido como um dos 
temas-chave dentro da computação, pois o estudo de estruturas de dados faz parte do núcleo 
essencial de disciplinas em qualquer curso de Ciência ou Engenharia da Computação. As maté- 
rias introdutórias são apresentadas em uma seguência de duas ou trés disciplinas, Estruturas de 
dados elementares são introduzidas em uma primeira disciplina de programação ou introdução à 
computação, e a estes seguem-se introduções mais aprofundadas sobre estruturas de dados. Além 
disso, essas disciplinas normalmente são seguidas de estudos mais detalhados sobre estruturas de 
dados e algoritmos. Acredita-se que o papel central do projeto de estruturas de dados e algorit- 
mos nos curriculos é totalmente justificado, dada a importância de estruturas de dados eficientes 
em sistemas de software, incluindo a Internet, sistemas operacionais, bancos de dados, compila- 
dores e sistemas de simulação científica. 


* Publicado pela Bookman Editora com o tíbulo Projeto de Algoritmos: Fundamentos, Análise e Exemplos da Internet. 
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Prefácio 


Com o surgimento do paradigma orientado a objetos e seu uso preferencial para a imple- 
mentação de software reutilizável e robusto, tentou-se manter uma visão orientada a objetos no 
texto. Uma das idéias principais na abordagem orientada a objetos é a de que se deve apresentar 
dados como sendo encapsulados com os métodos que os acessam e modificam. Ou seja, mais do 
que ver dados simplesmente como uma coleção de bytes e endereços, pensa-se em dados como 
instâncias de um dipo abstrato de dados (TAD) que inclui um repertório de métodos para realizar 
operações sobre os dados. De forma similar, soluções orientadas a objetos são frequentemente 
organizadas usando-se padrões de projeto comuns, que facılitam a reutilização de software e 
aumentam sua robustez. Assim, apresenta-se cada estrutura de dados usando TADs e suas respec- 
tivas implementações, introduzindo importantes padrões de projeto como forma de organizar as 
implementações em classes, métodos e objetos. 

Para cada TAD analisado neste livro, apresenta-se uma interface Java correspondente. Além 
disso, estruturas de dados concretas que implementam os TADs são fomecidas na forma de 
classes Java que operacionalizam as interfaces apresentadas. Também são fornecidas imple- 
mentações em Java de algoritmos básicos (como ordenação e busca em grafos) e de aplicações 
exemplo de estruturas de dados (como busca de "tags" HTML e álbuns de fotografias). Devido 
às limitações de espaço, algumas vezes estão apenas fragmentos de código no texto, deixando o 
restante do código fonte disponível no site Web correspondente, http: java. datastructures. net. 

O código Java que implementa as estruturas de dados básicas neste livro está organizado em 
um único pacote Java, ret datastructures. Este pacote compõe uma biblioteca coerente de estru- 
turas de dados e algoritmos em Java especialmente projetada para fins educacionais, de forma 
complementar ao framework de coleções de Java, 


Educação com valor agregado pela Web" 


Este livro é acompanhado por um vasto site Web: 
htip: java datastructures.net 


Os alunos são encorajados à usar este site juntamente com o livro para auxiliar nos exercicios 
e melhorar o entendimento dos temas. Os professores também são bem-vindos, devendo usar o site 
para auxiliá-los no planejamento, na organização e na apresentação do material de seus cursos. 


Para o estudante 


Para todos os leitores e em especial para os estudantes, incluiu-se: 


todos os códigos fonte Java apresentados neste livro; 
aversão para estudantes do pacote net. оса тс ле: 
as transparências em formato PDF (quatro por página), 


um banco de dados de dicas sobre todos os exercicios, indexados pelo número do pro- 
blema; 

* animações Java е applets interativos sobre estruturas de dados e algoritmos; 

* links para outras fontes sobre estruturas de dados e algoritmos. 


Acredita-se que as animações Java e as applets interativas possam ser especialmente interes- 
santes, uma vez que permitem que o leitor interaja com as diferentes estruturas de dados, o que 
conduz a um melhor entendimento dos diferentes TADs, Além disso, as dicas podem ser muito 
úteis para qualquer um que necessite de uma ajuda para começar certos exercícios. 


* Esta чеп refere-se ac site da editora original E dodos os swplenentos aqui harados estar em Inghis, 
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Para o professor” 
Para os professores que usarem este livro, incluem-se os seguintes recursos adicionais: 


= solução para mais de 200 dos exercicios do livro: 
e exercicios adicionais indexados por palavra-chave; 
* o pacote net.datastructures completo; 

e Lransparéncias em formato PowerPoint; 


As transparencias são editáveis, de maneira que o professor que adote este livro tem liberda- 
de para personalizar suas apresentações. 


Um recurso para ministrar estruturas de dados e algoritmos 


Este livro contém vários fragmentos de códigos Java e fragmentos de pseudo-código, e mais de 
670 exercícios divididos, grosso modo, em 40% de exercícios de reforço, 40% de exercícios de 
criatividade e 20% de projetos de programação. 

Pode ser usado para as disciplinas CS TO? (versões VOB}. CS 103 (versões MOB), CSI 11 
(versão A) ejou C3112 (versões APONTA) do Currículo de Ciência da Computação da IEEE/ 
ACM 2001, usando-se as unidades de instrução como definido na Tabela 0.1. 


Unidade de instrução Material relevante | 


PLL Visão geral sobre linguagens de programação Capitulos ] e 2 


PLZ. Mus virtuius Seções 14,11, MEL Ze 14,1, 


PL3. Intrexbugio 4 tradição de linguagens Seile 1,9 | 


FLA. Declarações e tipos Secoes 1.1, 2:4 e 2.3 
PLS, Mecanisimes de abstrasün sectas 2,4, 5.1, 5,2, 5,5, 5, 1,1, 56,2, bd, 5,5, 7.1, 7.3.1, 8.1, 
91, 9,3, Пё, e 13.1 


PL fr. Programação Orientada a Objetos Capítulos 1 e 2 e seções 67 ¿63,747,813 133.1 


PET. Consinaqóss fundan obs em programação Capitulos | & 2 


PEL Algoritmos e solução de problemas Seções 19 e 42 


mesm MÀ eg gen 


—- ze —L.. 


PEA, Езера de dados fuadanentais Seções Al, 5, N T 4,3, 5.1 - 6,3, 7 1.7 3. 7 Е ЖА À, 1- DA, 
10.1 e L3. I 


s3035 р 
Capítulo 2 e seções 62,2, 6,3, 7,37, B 12g 133,1 

SEL Usando API: Seções dd, 5,1. 5.2, 5,3, 6.1.1. 6.2, бй, bd, 7.1, TAN, 81, 
931,293 lie 13.1 

AL! Anl de algoritmos hüsucos mE Capítulo 4 

ALE. Estratégias algositmicas Seções 11.1.4. 1171, 12.2.0, 12:428 12,52 


ALS. Computação de algoritmos fundamentais Seções B. 1,4, 8.2.3, 8.3.5, 924 9.3.3 c Capitulos 11, E2 13 


DSL, Ешй, relações e eonmunbos Sectas dl, Ale 11.0 


1453, Técnicas de prova Seções 4,5, Al A, 7,33, BA, 10.2, 10,3, 104, 10.5, 11.2.1, 
11.3, 1.6.2, 13.1, 133.1, 134 145 
1054, Contagem Seções 22,5 e 1.5 


DSS., Grafos e árvores es 7, E, Пе 13 


156, Руса ае discreta Apéndice À e seções 9.2.2, 9.4.2, 11.2, le 11,7 


Tabela 0.1 Material para as unidades do currículo de computação da IEEE/ACM 2001 


= Professor interessados em receber material de apodo dem inglés) devem entrar em contato eom a Вак пада Соога. pelo ende 
ré secretvariaeditoanal E actemed.oconm. br e anexas comprovante de docência. 
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24  Estruturas de Dados e Algoritmos em Java 


1.1 


Iniciando: classes, tipos e objetos 


Construir estruturas de dados e algoritmos requer a comunicação de instruções detalhadas para 
um computador, Uma excelente maneira de fazer isso é usar uma linguagem de programação de 
alto nível tal como Java. Este capítulo apresenta uma visão geral da linguagem Java assumindo 
que o leitor esteja familiarizado com alguma linguagem de programação de alto nível. Este livro, 
entretanto, não provê uma descrição completa da linguagem Java. Existem aspectos importantes 
da linguagem que não são relevantes para o projeto de estruturas de dados e que não são inclui- 
dos aqui, tais como threads e sockets. O leitor que desejar aprender mais sobre Java deve obser- 
var as notas do final deste capítulo. Iniciamos com um programa que imprime “Hello Universe!” 
na tela, que é mostrado e dissecado na Figura 1.1. 


todo código Jara chaves indicara 
deve pertencer e inicio do corpo ba mbtodo não 
m uma сіљева da classe i 4 
isto diz que tado mundo pode este É o noma 
dia cl 
er xe а nome desta OP parâmetros passados para este 
Ў пына método (neste caso os argumentos 


[publ le: class Universa da linha de comando passados como 
Pin (Espora 1 aN = me e —_ ur arranjo de strings) 


este programa "public static’ void main] (String[] args) ( a Saves indicam o início 
ne L AE ESA — — - do corpo do método 


pertenca a classe, t ‚pri {а i ja cia dá 
as System.out рпїгїїп ( Hello Universe!*) Dee 
(mass sobre Те. EUR deste comando 
lasa, adiante} | } | D rara do método qua se о parlimetro pausado para 
chaves para  __ deseja chamar (nesta caso o método (neste саво о 
fechar o corpo api] | e método para imprimir string que será impresso) 
da classe bi strings ma tela) 


Figura 1.1 O programa "Hello Universe!” 


Os principais “atores” em um programa Java são os objetos. Os objetos armazenam dados e 
fornecem os métodos para acessar e modificar esses dados, Todo objeto é instância de uma classe 
que define o tipo do objeto, bem como os tipos de operações que executa, Os membros críticos 
de uma classe Java são os seguintes (classes também podem conter definições de classes aninha- 
das, mas essa é uma discussão para mais tarde): 


* Dados de objetos Java são armazenados em variáveis de instância (também chamadas 
de campos). Por essa razão, se um objeto de uma classe deve armazenar dados, então 
sua classe deve especificar variáveis de instância para esse fim. As variáveis de instância 
podem ser de tipos básicos (tais como inteiros, números de ponto flutuante ou booleanos) 
ou podem se referir a objetos de outras classes. 

* As operações que podem atuar sobre os dados e que expressam as “mensagens” às quais 
os objetos respondem são chamadas de métodos, e estes consistem de construtores, sub- 
programas e funções. Eles definem o comportamento dos objetos daquela classe. 


Como as classes são declaradas 


Resumindo, um objeto é uma combinação específica de dados e dos métodos capazes de processar 
e comunicar esses dados. As classes definem os tipos dos objetos; por essa razão, objetos são tam- 
bém chamados de instâncias da classe que os define, e usam o nome da classe como seu tipo. 

Um exemplo de definição de uma classe Java é apresentado no Trecho de código 1.1. 
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public class Counter I 
protected int count; // uma simples variável de instância inteira 
/** O construtor default para um objeto Counter */ 
Counter ) [ count = 0; } 
/** Um método de acesso para recuperar o valor corrente do contador */ 
public int getCount( ) { return count; | 
/** Um método modificador para incrementar o contador */ 
public void incrementCount() { count-- +; } 
= Um método modificador para decrementar o contador */ 
public void decrementCount( ) {count ——; ] 


} 


Trecho de código 1.1 A classe Counter para um contador simples que pode ser acessado, in- 
crementado e decrementado, 


Neste exemplo, observa-se que a definição da classe está delimitada por chaves, isto é, co- 
meça por um "[" e termina com um "|". Em Java, qualquer conjunto de comandos entre chaves 
“e” define um bloco de programa. 

Assim como a classe Universe, a classe Counter é pública, o que significa que qualquer outra 
classe pode criar e usar um objeto Counter. O Counter tem uma variável de instância — um inteiro 
chamado count. Esta variável é inicializada com zero no método construtor. Counter, que é cha- 
mado quando se deseja criar um novo objeto Counter (este método sempre tem ó mesmo nome 
que a classe a qual pertence). Esta classe também tem um método de acesso, getCount, que retor- 
na o valor corrente do contador. Finalmente, esta classe tem dois métodos de atualização — o mé- 
todo incrementCount, que incrementa o contador, e o método decrementCount, que decrementa 
o contador. Na verdade, esta é uma classe extremamente aborrecida, mas pelo menos mostra a 
sintaxe e à estrutura de uma classe Java. Mostra também que uma classe Java não precisa ter um 
método chamado main (mas tal classe não consegue fazer nada sozinha). 

O nome da classe, método ou variável em Java é chamado de identificador, e pode ser qual- 
quer string de caracteres desde que inicie por uma letra e seja composto por letras, números € 
caracteres sublinhados (onde “letra” e “número” podem ser de qualquer língua escrita definida 
no conjunto de caracteres Unicode). Listam-se as exceções a esta regra geral para identificadores 
Java na Tabela 1.1. 


Palavras reservadas 


abstract else interface switch 


boolean extends long synchronized 
break false native this 
byte final new throw 
case finally null throws 

; catch float package transient 
char for private true 
class gato protected — try 
const if public void 
continue implements return volatile 
default import short while 
da instanceof static 
double int super 


Tabela 1.1 Lista de palavras reservadas Java. Estas palavras não podem ser usadas como no- 
mes de variáveis ou de métodos em Java. 
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Modificadores de classes 


Os modificadores de classes são palavras reservadas opcionais que precedem a palavra reservada 
class. Alé agora, foram vistos exemplos que usavam a palavra reservada public. Em geral, os 
diferentes modificadores de classes e seu significado são os que seguem: 


* O modificador de classe abstract descreve uma classe que possui métodos abstratos. Mé- 


lodos abstratos são declarados com a palavra reservada abstract e são vazios (isto €, não 
possuem um bloco de comandos definindo o código do método). Se uma classe tem ape- 
nas métodos abstratos e nenhuma variável de instância, € mais adequado considerá-la uma 
interface (ver Seção 2,4), de forma que uma classe abstract é normalmente uma mistura 
de métodos abstratos e métodos verdadeiros. (Discutem-se classes abstratas e seus usos 
na Seção 2,4), 

O modificador de classe final descreve uma classe que não pode ter subclasses. (Discute- 
se esse concerto no próximo capítulo). 

O modificador de classe public descreve uma classe que pode ser instanciada ou estendida 
por qualquer coisa definida no mesmo pacote ou por qualquer coisa que importe a classe. 
(Isso é melhor detalhado na Seção 1.8.) Todas as classes públicas são declaradas em arqui- 
vo próprio exclusivo nomeado classmame java, onde "classname" é o nome da classe, 
se o modificador de classe public não é usado, então a classe é considerada amigável, 
Issa significa que pode ser usada e instanciada por qualquer classe do mesmo pacote. Esse 
é o modificador de classe default. 


1.1.1 


Tipos båsicos 
Os tipos dos objetos são determinados pela classe de origem. Em nome da eficiència e da sim- 
plicidade, Java ainda oferece os seguintes fipos básicos (também chamados de tipos primitivos) 
que não são objetos: 


boolean valor booleano: true ou false 


char caracter Unicode de 16 bits 

byte inteiro com sinal em complemento de dois de 8 bits 
short inteiro com sinal em complemento de dois de 16 bits 
int inteiro com sinal em complemento de dois de 32 bits 
long inteiro com sinal em complemento de dois de 64 bits 
laat número de ponto flutuante de 32 hits (IEEE 754- 1985) 


double — nümero de ponto flutuante de 64 bits (IEEE 754-1985) 


Uma variável declarada como tendo um desses tipos simplesmente armazena um valor deste 
tipo, em vez de uma referência para um objeto. Constantes inteiras, tais como 14 ou 195, são do tipo 
int, à menos que seguidas de imediato por um “Lou “I”, sendo, neste caso, do tipo long. Constantes 
de ponto flutuante, coma 3.1415 ou 2. 15825, são do tipo double, a menos que seguidas de imediato 
por um “Fou um 'f', sendo, neste caso, do tipo float. O Trecho de código 1.2 apresenta uma classe 
simples que define algumas variáveis locais de tipos básicos no método main. 


public class Base [ 
public static void main (String| ] args) [ 
boolean flag = true; 


char ch = '#); 
byte b = 12; 
shorts = 24; 


int i = 257; 
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lang | = 890L; if Observar o uso do “L” aqui 

float f = 3.1415Е; 4 Observar o uso do “Fº aqui 

double d = 2,1828; 

System.out.println ("flag = " + Пад); // o "+" indica concatenação de strings 
System.out.println ("ch = = ch, 


System out.printin ("b = " + bh; 
System.out.printin (^s = " + 8}; 
System.out.printin (^i = " + ik 
System.out.printin(*1 = " «IJ; 
System.out.printin (^£ = " +4); 
System.out.printin (^d = " +d); 
| 
] 
Trecho de código 1.2. A classe Base mostrando o uso dos tipos básicos. 
Comentários 


Observar o uso de comentários neste e nos outros exemplos. Os comentários são anotações para 
uso de humanos, e não são processadas pelo compilador Java. Java permite dois tipos de co- 
mentários — comentários de bloco e comentários de linha — usados para definir o texto a ser 
ignorado pelo compilador. Em Java, usa-se um /* para começar um bloco de comentário e um 
*/ para fechá-lo, Deve-se destacar os comentários iniciados por /**, pois tais comentários tem 
um formato especial que permite que um programa chamado Javadoc os leia e automaticamente 
gere documentação para programas Java. À sintaxe e interpretação dos comentários Javadoc será 
discutida na Seção 1.9.3 
Além de comentários de bloco, Java usa o // para começar comentários de linha e ignorar 

tudo mais naquela linha. Por exemplo: 

pe 

* Este é um bloco de comentário 

+y 


Este à um comentário de linha 


Saida da classe Base 


A saída resultante da execução da classe Base (método main) é mostrada na Figura 1,2. 


flag = true 
ch = А 
b = 12 
5 = 24 
і = 257 
| = 890 
f = 3.1415 
d = 2.1828 


Figura 1.2 Safda da classe Base. 


Mesmo não se referindo a objetos, variáveis dos tipos básicos são úteis no contexto de obje- 
tos, na medida em que são usadas para definir variáveis de instâncias (ou campos) dentro de um 
objeto, Por exemplo, a classe Counter (Trecho de código 1.1) possuí uma única variável de ins- 
tância do tipo int. Uma outra característica adicional de Java é o fato de que variáveis de instância 
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sempre recebem um valor inicial quando o objeto que as contém é criado (seja zero, falso ou um 
caracter nulo, dependendo do tipo). 


1.1.2 Objetos 


Em Java, um objeto novo é criado a partir de uma classe usando-se o operador new. O operador 
new cria um novo objeto a partir de uma classe especificada e retorna uma referência para este 
objeto. Para criar um objeto de um tipo específico, deve-se seguir o uso do operador new por 
uma chamada a um construtor daquele tipo de objeto. Pode-se usar qualquer construtor que faça 
parte da definição da classe, incluindo o construtor default (que não recebe argumentos entre os 
parênteses). Na Figura 1.3, apresentam-se vários exemplos de uso do operador new que criam 
novos objetos e atribuem uma referência para os mesmos a uma variável. 


n nome 
desta даза mintaxe padrão 
рага declarar 


Pt um malt 
public class Example { 
declara a varlivel c como 


public static void main (String | args) [sendo do tipo Counter lato 


RE dd do pode es referir a 
varii qualquer objeto Counter 
declara a магії Counter c: 


a como sendo c qe coe PEU ет оны 
tipo Counter Goumkär e retorna 
Counter d| = "new Counter); uma referência 
раға o maama 
cz new Counter() ; atribui a referência ас novo 


objeto para а varióres] а 


rie ond ts 
=! uma refarüncia para o mesmo 


atribui a rafer£ncin do 
| novo objeto a varibwel 6 
rc, referirem рага а 


mesmo objeto que e (o objeto 
} que d referenciava não tem mals 
аттата valire] referenciando-o) 


Figura 1.3 Exemplos de uso do operador new. 


A chamada do operador new sobre um tipo de classe faz com que ocorram três eventos: 


* Um novo objeto é dinamicamente alocado na memória, e todas as variáveis de instância 
são inicializadas com seus valores padrão. Os valores padrão são null para variáveis obje- 
to e O para todos os tipos base, exceto as variáveis boolean (que são false por default). 

* O construtor para o novo objeto é chamado com os parâmetros especificados. O constru- 
tor atribui valores significativos para as variáveis de instância e executa as computações 
adicionais que devam ser feitas para criar este objeto, 

* Depois do construtor retornar, o operador new retorna uma referência (isto é, um ende- 
reco de memória) para o novo objeto recém criado. Se a expressão está na forma de uma 
atribuição, então este endereço é armazenado na variável objeto, e então a variável objeto 
passa a referir o objeto recém criado. 


Objetos numéricos 


Às vezes, quer-se armazenar números como objetos, mas os tipos básicos não são objetos, como 
já se observou. Para contomar esse problema, Java define uma classe especial para cada tipo bá- 
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sico numérico. Essas classes são chamadas de classes numéricas. Na Tabela 1.2, estão os tipos 
hásicos numéricos e as classes numéricas correspondentes, juntamente com exemplos de como 
se criam e se acessam os objetos numéricos. Desde o Java 5.0, a operação de criação é executada 
automaticamente sempre que se passa um número básico para um método que esteja esperando 
o objeto correspondente, Da mesma forma, o método de acesso correspondente é executado au- 
tomaticamente sempre que se deseja atribuir o valor do objeto Número correspondente a um tipo 
numérico básico. 


Bye | n=newBye((oyte)34) 
Short | n= new Shorti(short 100) 


Float 


Tabela 1.2 Classes numéricas de Java. Para cada classe é fornecido o tipo básico corresponden- 
te e expressões exemplificadoras de criação e acesso a esses objetos. Em cada linha, se admite 
que a variável n é declarada com o nome de classe correspondente. 


| nintValue() | 
| _ Long | n= new Long(10849L) n.longValue() 


Objetos string 


Uma string é uma seqüéncia de caracteres que provêm de algum alfabeto (conjunto de todos os 
caracteres possíveis). Cada caracter с que compõe uma string ғ pode ser referenciado por seu 
índice na string, a qual é igual ao nümero de caracteres que vem antes de c em s (desta forma, 
o primeiro caractere tem índice 0). Em Java, o alfabeto usado para definir strings é o conjunto 
internacional de caracteres Unicode, um padrão de codificação de caracteres de 16 bits que cobre 
as linguas escritas mais usadas. Outras linguagens de programação tendem a usar o conjunto de 
caracteres ASCI, que é menor (corresponde a um subconjunto do alfabeto Unicode baseado em 
um padrão de codificação de 7 bits). Além disso, Java define uma classe especial embutida de 
objetos chamados objetos String. 
Por exemplo, P pode ser 


"hogs and dogs" 


que tem comprimento 13 e pode ter vindo da página Web de alguém. Neste caso, o caractere de 
indice 2 é *g' e o caractere de índice 5 é “a”. Por outro lado, P poderia ser a string *CGTAATAG- 
TTAATCCG", que tem comprimento 16 e pode ser proveniente de uma aplicação cientifica de 
seqüenciamento de DNA, onde o alfabeto é [G, C, A, T]. 


Concatenação 


O processamento de strings implica em lidar com strings. À operação básica para combinar strings 
chama-se concatenação, а qual toma uma string P e uma string Q e as combina em uma nova 
string denotada P+Q, que consiste de todos os caracteres de P seguidos por todos os caracteres 
de Q. Em Java, o operador “+” age exatamente desta maneira quando aplicado sobre duas strings. 
Sendo assim, em Java é válido (e muito útil) escrever uma declaração de atribuição do tipo: 


String s = "kilo" + "meters"; 


Essa declaração define uma variável s que referencia objetos da classe String e Ihe atribui 
a string "kilometers". (Mais adiante, neste capítulo, serão discutidos mais detalhadamente 
comandos de atribuição e expressões como a apresentada), Pressupóe-se ainda que todo objeto 
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Java tem um método predefinido chamado toString( ) que retorna a string associada ao objeto. 
Esta descrição da classe String deve ser suficiente para a maioria dos usos. Analisaremos a classe 
String e sua “parente”, a classe StringBuffer, na Seção 12.1. 


Referências para objetos 


Como mencionado acima, a criação de um objeto novo envolve o uso do operador new para alo- 
car espaço em memória para o objeto e usar o construtor do objeto para inicializar esse espaço. 
A localização ou endereço deste espaço normalmente é atribuída para uma variável referência. 
Conseqüentemente, uma variável referência pode ser entendida como sendo um “ponteiro” para 
um objeto. 1550 € como se a variável fosse o suporte de um controle remoto que pudesse ser usa- 
do para controlar o objeto recém-criado (o dispositivo). Ou seja, a variável tem uma maneira de 
apontar para o objeto e solicitar que o mesmo faça coisas ou acessar seus dados. Este conceito 
pode ser visto na Figura 1.4. 


a variável releráncia 


Figura 1.4 Demonstrando o relacionamento entre objetos e variáveis referencia. Quando se 
atribui uma referência para um objeto (isto é, um endereço de memória) para uma variável refe- 
rência, é como se fosse armazenado um controle remoto do objeto naquela variável. 


O operador ponto 


Toda a variável referência para objeto deve referir algum objeto, a menos que seja null, caso em 
que não aponta para nada. Seguindo com a analogia do controle remoto, uma referência null é um 
suporte de controle remoto vazio. Inicialmente, a menos que se faça a variável referência apontar 
para alguma coisa através de uma atribuição, ela é null. 

Pode haver, na verdade, várias referências para um mesmo objeto, e cada referência para um 
objeto específico pode ser usada para chamar métodos daquele objeto. Esta situação corresponde a 
existirem vários controles remotos capazes de atuar sobre o mesmo dispositivo. Qualquer um dos 
controles pode ser usado para fazer alterações no dispositivo (como alterar o canal da televisão). 
Observe que se um controle remoto é usado para alterar o dispositivo, então o (único) objeto apon- 
tado por todos os controles se altera. Da mesma forma, se uma variável referência for usada para al- 
terar o estado do objeto, então seu estado muda para todas as suas referências. Este comportamento 
vem do fato de que são muitas referências, mas todas apontando para o mesmo objeto. 

Um dos principais usos de uma variável referência é acessar os membros da classe a qual 
pertence o objeto, a instância da classe. Ou seja, uma variável referência é útil para acessar os 
métodos e as variáveis de instância associadas com um objeto. Este acesso é feito através do 
operador ponto (^7). Chama-se um método associado com um objeto usando o nome da variável 
referência seguido do operador ponto, e então o nome do método e seus parâmetros. 
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Isso ativa o método com o nome especificado associado ao objeto referenciado pela variável 
referência. Opcionalmente, podem ser passados vários parâmetros. Se existirem vários métodos 
com o mesmo nome definido para este objeto, então à máquina de execução do Java irá usar 
aquele cujo número de parâmetros e tipos melhor combinem. O nome de um método combinado 
com a quantidade e o tipo de seus parâmetros chama-se de assinatura do método, uma vez que 
todas essas partes são usadas para determinar o método correto para executar uma certa chamada 
de método. Considerem-se os seguintes exemplos: 


oven.cookDinnerl j; 
cvencookDinnerifood!: 
oven.cookDinner(food, seasoning): 


Cada uma dessas chamadas se refere. na verdade, a métodos diferentes, definidos com o 
mesmo nome na classe a qual pertencem. Observa-se, entretanto, que a assinatura de um método 
em Java não 1nclui o tipo de retorno do método, de maneira que Java não permite que dois méto- 
dos com a mesma assinatura retornem tipos diferentes. 

Variáveis de instáncia 

Classes Java podem definir varidvetrs de instância, também chamadas de campos. Essas variáveis 
representam os dados associados com os objetos de uma classe. As vanáveis de instância devem 
ter um fipo, que pode tanto ser um fipo básico (como int, float, double) ou um tipo referência 
(сото na analogia do controle remoto), isto é, uma classe, como String, uma interface (ver Seção 
2.4) ou um arranjo (ver Seção 1.5). Uma instância de variável de um tipo básico armazena um wa- 
lor do tipo básico, enquanto que variáveis de instância, declaradas usando-se um nome de classe, 
armazenam uma referência para um objeto daquela classe. 

Continuando com a analogia entre variáveis referência e controles remotos, variáveis de instän- 
cia são como parámetros do dispositivo que podem tanto ser lidos, como alterados usando-se o con- 
trole remoto (ais como os controles de volume e canal do controle remoto de uma televisão). Dada 
uma variável referência v, que aponta para um objeto e, pode-se acessar qualquer uma das variáveis 
de instância de o que as regras de acesso permitirem. Por exemplo, variáveis de instância públicas 
podem ser acessadas por qualquer pessoa. Usando o operador ponto, pode-se obter o valor de qual- 
quer variável de instância, i. usando-se vi em uma expressão aritmética. Da mesma forma pode-se 
alterar o valor de qualquer variável de instância i, escrevendo wi no lado esquerdo do operador de 
atribuição ("="). (Ver Figura 1.5.) Por exemplo, se gnome se refere a um objeto Gnome que tem as 
variáveis de instância públicas name e age, então os seguintes comandos são possíveis: 


gnome.name = "ProfessorSmythe"; 
gnome.age = 132; 


Entretanto, uma referência para objeto não tem de ser apenas uma variável] referência. Pode ser 
qualquer expressão que retorna uma referência para objeto. 


Modificadores de variáveis 


Em alguns casos, o acesso direto a uma variável de instância de um objeto pode não estar habili- 
tado, Por exemplo, uma variável de instância declarada como privada em alguma classe só pode 
ser acessada pelos métodos definidos dentro da classe, Tais vanáveis de instância são parecidas 
com parâmetros de dispositivo que não podem ser acessados diretamente pelo controle remoto. Por 
exemplo, alguns dispositivos tem parâmetros internos que só podem ser lidos ou alterados por téc- 
nicos da fábrica (e o usuário não está autorizado a alterá-los sem violar a garantia do dispositivo). 
Quando se declara uma variável de instância, pode-se, opcionalmente, definir um modifica- 
dor de vanável, seguido pelo tipo e identificador daquela variável. Além disso, também é opcio- 
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Figura 1.5 Demonstrando a maneira pela qual uma referencia para objeto pode ser usada рага ob- 
ter ou alterar variáveis de instância em um objeto (assumindo que se tem acesso a estas varläveis). 


nal atribuir um valor inicial para a varıävel (usando o operador de atribuição “=”, As regras para 
o nome da variável são as mesmas de qualquer outro identificador Java. O tipo da variável pode 
ser tanto um tipo básico, indicando que a variável armazena valores daquele tipo, ou um nome de 
classe, indicando que a variável é uma referência para um objeto desta classe. Por fim, © valor 
inicial opcional que se pode atribuir a uma variável de instância deve combinar com o tipo da 
variável. Como exemplo, definiu-se a classe Gnome*, que contém várias definições de variáveis 
de instância, apresentada no Trecho de código 1.3. 

O escopo (ou visibilidade) de uma variável de instância pode ser controlado através do uso 
dos seguintes modificadores de varidveis: 


* public: qualquer um pode acessar variáveis de instância públicas. 

• protected: apenas métodos do mesmo pacote ou subclasse podem acessar variáveis de 
mstância protegidas. 

* private: apenas métodos da mesma classe (excluindo métodos de uma subclasse) podem 
acessar vartávels de instâncias privadas. 

+ Se nenhum dos modificadores acima for usado, então a variável de instância é considera- 
da amigável, Variáveis de instância amigáveis podem ser acessadas por qualquer classe no 
mesmo pacote. Os pacotes são discutidos detalhadamente na Seção 1.8. 


Além dos modificadores de escopo de vartável, existem também os seguintes modificadores 
de usc 


+ static: a palavra reservada static é usada para declarar uma variável que é associada com 
a classe, não com instancias individuais daquela classe. Variáveis static são usadas para 
armazenar informações globais sobre uma classe (por exemplo, uma variável static pode 
ser usada para armazenar a quantidade total de objetos Gnome criados). Variáveis static 
existem mesmo se nenhuma instância de sua classe for criada. 

* final: uma variável de instância final é um tipo de variável para o qual se deve atribuir um 
valor inicial, e para a qual, a partir de então, não é possível atribuir um novo valor. Se for 
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de um tipo básico, então é uma constante (como a constante MAX HEIGHT na classe Gno- 
ma). Se uma variável objeto € final, então irá sempre se referir ao mesmo objeto (mesmo 
se o objeto alterar seu estado interne. 


public class Gnome { 
// Variáveis de instância: 
public String name; 
public int age; 
public Gnome gnomeBuddy; 
private boolean magical = false; 
protected double height = 2.6; 
public static final int MAX HEIGHT = 3; // altura máxima 
!! Construtores: 
Gnome (Sting nm, int ag, Gnome bud, double hat) | “totalmente parametrizado 
name = nm, 
age = ag; 
gnomebBuddy = bud, 
height = hat; 
) 
Gnomel | [ // Constructor default 
name= "E unple"; 
age = 204; 
gnomeBuddy = null; 
height = 2.1; 
| 
fi Metodos: 
public static void makeKing (Gnome hj { 
h.name = "King * + hgelRealNamel |; 
h.magical = true; // Apenas a classe Gnome pode referenciar este campo. 
} 
public void makeMekKing () { 
name = "King * getHealMameij |; 
magical = true; 
] 
public boolean isMagicall ) { return magical; } 
public void setHeight(nt newHeight) | height = newHeight; | 
public String getName() [ return "1 won't cell:i":] 
public String getHeallarne( | { return name: ] 
public void renameGnome(String s) | name = 5: ) 


Trecho de código 1.3 A classe Gnome. 


Observa-se o uso das vanáveis de instáncia no exemplo da classe Gnome, As variáveis age, 
magical e height* são de tipos básicos, a variável name é uma referência para uma instância da 
classe predefinida String. e a variável gnomeBuddy** é uma referência pará um objeto da clas- 
se sendo definida. A declaração da variável de instância MAX_HEIGHT*** está tirando proveito 
desses dois modificadores para definir uma “variável” que tem um valor constante fixo. Na ver- 
dade, valores constantes associados a uma classe sempre devem ser declarados static c final. 


“Mode T. “dade”, “mágica” e “altura”, respectivamente 
del. Compantero do duende 
++ М фе Т. Largura máxima 
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1.1.3 


Tipos enumerados 


Desde a versão 5.0, Java suporta tipos enumerados chamados enums. Esses tipos são permitidos 
apenas para que se possa obter valores provenientes de conjuntos específicos de valores. Eles são 
declarados dentro de uma classe como segue: 


modificador enum nome [some valor, 


p nome valor, … nome. valor, || 


onde modificador pode ser vazio, public, protected ou private. O nome desta enumeração, 
rome, pode ser qualquer identificador Java. Cada um dos identificadores de valor, nome value, 
é o nome de um possível valor que variáveis desse tipo podem assumir. Cada um desses nomes 
de valor pode ser qualquer identificador Java legal, mas, por convenção, normalmente começam 
por letra maiúscula. Por exemplo, a seguinte definição de tipo enumerado pode ser útil em um 
programa que deve lidar com datas: 


public enum Day! MON, TUE, WED, THU, FRI, SAT, SUM X; 


Uma vez definido, um tipo enumerado pode ser usado na definição de outras variáveis da 
mesma forma que um nome de classe. Entretanto, como o Java conhece todos os nomes dos 
valores possíveis para um tipo enumerado, se um tipo enumerado for usado em uma expressão 
string, o Java irá usar o nome do valor automaticamente. Tipos enumerados também possuem 
alguns métodos predefinidos, incluindo o método value Of, que retorna o valor enumerado que é 
o mesmo que uma determinada string. Um exemplo de uso de tipo enumerado pode ser visto no 
Trecho de código 1.4. 


public class DayTripper { 

public enum Day [ MON, TUE, WED, THU, FRI, SAT, SUN |; 

public static void main(String[ | args) { 
Day d ^ Day. MON; 
System.out.printin(^Initially d is " + dy 
d = DayWED; 
System. out. printi" Then it ia " + dj; 
Day t = Day.valueOf(" WED"): 
System.out.printin(^T say d and t are the same: " + {а == Ùk 


A saída deste programa é: 


Initially d is MOM 
Then it is WED 
{ say d and t are the same: true 


Trecho de código 1d Um exemplo de uso de tipo enumerado 


1.2 Métodos 


Os métodos em Java são conceitualmente similares a procedimentos e funções em outras lingua- 
gens de alto nivel. Normalmente correspondem a “trechos” de código que podem ser chamados 
em um objeto específico (de alguma classe), Os métodos podem admitir parámetros como argu- 
mentos, € seu comportamento depende do objeto аб qual pertencem e dos valores passados por 
qualquer parâmetro. Todo método em Java é especificado no corpo de uma classe, À definição de 
um método compreende duas partes: a assinatura, que define o nome e os parâmetros do méto- 
do, e o corpo, que define o que o método realmente faz. 
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Um método permite ao programador enviar uma mensagem para um objeto. À assinatura do 
método especifica como uma mensagem deve parecer e o corpo do método especifica o que o 
objeto irá fazer quando receber tal mensagem. 


Declarando métodos 
A sintaxe da definição de um método é como segue: 


modificadores tipo nomeltipo, pardmetroç .... po, , parámetro, dd 
if corpo do metodo... 
} 


Cada uma das partes desta declaração é importante e será descrita em detalhes nesta seção. A 
seção de modificadores usa os mesmos tipos de modificadores de escopo que podem ser usados 
para variáveis, tais como public, protected e static, com significados parecidos. À seção fipo 
define o tipo de retorno do método. O nome é o nome do método, e pode ser qualquer identifica- 
dor Java válido. À lista de parámetros e seus tipos declaram as vanáveis locais que correspondem 
aos valores que são passados como argumentos para o método, Cada declaração de tipo, tipo, 
pode ser qualquer nome tipo Java e cada parâmetro, pode ser qualquer identificador Java, Esta 
lista de identificadores e seus tipos pode ser vazia, o que significa que não existem valores para 
serem passados para este método quando for acionado. As variáveis parâmetro, assim como as 
variáveis de instância da classe, podem ser usadas dentro do corpo do método. Da mesma forma, 
os outros métodos desta classe podem ser chamados de dentro do corpo de um método. 

Quando um método de uma classe é acionado, é chamado para uma instância especifica da 
classe, e pode alterar о estado daquele objeto (exceto o método static, que é associado com a 
classe propriamente dita). Por exemplo, invocando-se o método que segue em um grome parti- 
cular, altera-se seu nome. 


public vold renameGnome (String s) { 
name = =; // Alterando a variável de instância nome deste gnome. 


| 


Modificadores de métodos 


A semelhança das variáveis de instância, modificadores de métodos podem restringir o escopo 
de um método: 


public: qualquer um pode chamar métodos públicos. 
protected: apenas métodos do mesmo pacote ou subclasse podem chamar um método 
protegido, 

е private: apenas métodos da mesma classe (excluindo os métodos de subclasses) podem 
chamar um método privado. 

* Se nenhum dos modificadores acima for usado, então o método é considerado amigável, 
Métodos amigáveis só podem ser chamados por objetos de classes do mesmo pacote, 


Os modificadores de método acima podem ser precedidos por modificadores adicionais: 


* abstract um método declarado como abstract não terá código. A lista de parümetros de um 
método abstrato é seguida por um ponto-e-vírgula, sem o corpo do método. Por exemplo: 
public abstract void setHeight (double newHeight): 
Métodos abstratos só podem ocorrer em classes abstratas. A utilidade desta construção 
será analisada na Seção 2,4, 
* final: este é um método que não pode ser sobrescrito por uma subclasse, 
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e static: este é um método que é associado com a classe propriamente dita e não com uma 
instância em particular. Métodos static também podem ser usados para alterar o estado de 
variáveis static associadas com a classe (desde que estas variáveis não tenham sido decla- 
radas como sendo final). 


Tipos de retorno 


Uma definição de método deve especificar o tipo do valor que o método irá retornar, Se o método 
não retorna um valor, então a palavra reservada vold deve ser usada. Se o tipo de retorno é void, 
o método é chamado de procedimento. caso contrário, é chamado de fundo. Para retornar um 
valor em Java, um método deve usar a palavra reservada return (e o tipo retornado deve combinar 
com o tipo de retorno do método). Na sequência, um exemplo de método (interno à classe Gno- 
me) que tem a forma de uma função: 


public boolean isMagical () ( 
return magical: 


| 


Assim que um return é executado em uma função Java, a execução do método termina, 

Funções Java podem retornar apenas um valor. Para retornar múltiplos valores em Java, 
deve-se combiná-los em um objeto composto cujas variáveis de instância incluam todos os valo- 
res desejados e, então, retornar uma referência para este objeto composto. Além disso, pode-se 
alterar o estado interno de um objeto que é passado para um método como outra forma de “retor- 
nar” vários resultados, 


Parámetros 


Us parámetros de um método são definidos entre parênteses, após o nome do mesmo, separados 
por vírgulas. Um parámetro consiste em duas partes: seu tipo e o seu nome. Se um método não 
tem parâmetros, então apenas um par de parênteses vazio é usado. 

Todos os parâmetros em Java são passados por valor, ou seja, sempre que se passa um 
parâmetro para um método, uma cópia do parâmetro é feita para uso no contexto do corpo do 
método, Ao se passar uma variável int para um método, o valor daquela variável é copiado. O 
método pode alterar a cópia, mas não o original. Quando se passa uma referência do objeto como 
parámetro para um método, então essa referência € copiada da mesma forma, É preciso lembrar 
que se podem ter muitas variávels diferentes referenciando o mesmo objeto, A alteração da refe- 
rência recebida dentro de um método não irá alterar a referência que foi passada para o mesmo, 
Por exemplo, аю passar uma referência g da classe Gnome рага um método que chama este 
parâmetro de h, então o método pode alterar a referência h de maneira que ela aponte para outro 
objeto, porém g continuará a referenciar o mesmo objeto anterior. O método, contudo, pode usar 
a referência h para mudar o estado interno do objeto, alterando assim o estado do objeto apontado 
por g (desde que g e h referenciem o mesmo objeto). 


Metodos construtoras 


Um construtor É um tipo especial de método que é usado para inicializar objetos novos quando 
de sua criação. Java tem uma maneira especial de declarar um construtor e uma forma especial de 
invocá-lo. Primeiro será analisada a sintaxe de declaração de um construtor: 


modificadores Hipo nomet tipa; parümetra, … tipo, , parámetro, 14 
// corpo do construtor... 
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Vê-se que a sintaxe é igual à de qualquer outro método, mas existem algumas diferenças es- 
senciais. O nome do construtor name, deve ser o mesmo nome da classe que constrói. Se a classe 
se chama Fish (“peixe”) então o construtor deve se chamar Fish da mesma forma. Além disso, 
um construtor não possui parámetro de retorno = seu tipo de retorno é o mesmo que seu nome 
implicitamente (que é também o nome da classe), Os modificadores de construtor, indicados aci- 
ma como modifiers, seguem as mesmas regras que os métodos normais, exceto pelo fato de que 
construtores abstract, static ou final não são permitidos, 

Por exemplo: 


public Fish (int w, String n) [ 
weight = чу; 
name = n; 


Definição e invocação de um construtor 


O corpo de um construtor é igual ao corpo de um método normal, com um par de pequenas ex- 
ceções. À primeira diferença diz respeito ao conceito conhecido como cadeia de construtores, 
tópico discutido na Seção 2.2.3 e que não é importante a esta altura. 

A segunda diferença entre o corpo de um construtor e o corpo de um método comum é que o 
comando return não é permitido no corpo de um construtor À finalidade deste corpo é ser usado 
para a inicialização dos dados associados com os objetos da classe correspondente. de forma que 
os mesmos fiquem em um estado inicial estável quando criados. 

Métodos construtores são ativados de uma única forma: devem ser chamados através do 
operador new. Assim, a partir da ativação, uma nova instância da classe é automaticamente cria- 
da, e seu construtor é então chamado para inicializar as variáveis de instância e executar outros 
procedimentos de configuração. Por exemplo, considere-se a seguinte ativação de construtor (que 
corresponde também a uma declaração da variável myFish* у: 


Fish myFish = new Fish (7, "Wally" 


Uma classe pode ter vários construtores, mas cada um deve ter uma assinatura diferente, ou 
seja, devem ser distinguiveis pelo tipo e número de parámetros que recebem. 


O método main 


Certas classes Java destinam-se a ser utilizadas por outras classes, e outras têm como finalidade 
definir programas executáveis**, Classes que definem programas executáveis devem conter um 
outro tipo especial de método para uma classe ~ o método main. Quando se deseja executar um 
programa executável Java, relerencia-se o nome da classe que define este programa, por exem- 
plo, disparando o seguinie comando (em um Shell Windows, Linux ou UNIX): 


java Aquarium 
Neste caso, o sistema de execução de Java procura por uma versão compilada da classe Aquarium 
("aquário"), e então ativa o método especial main dessa classe, Esse método deve ser declarado 
COIT SCEULC., 


public static void main(String[ ] args) ( 
if corpo do método main... 


* M.de Т. Meu peixe. 
**'M de T. Unliza-se a expressão “programa executivel (nandaan program} peste contexto para indicar um programa que é 
exexutaido sen i recessadade de uri navegador, não se refero a um arquivo binario executável. 
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Os argumentos passados para o método main pelo parámetro args são os argumentos de linha 
de comando fornecidos quando o programa é chamado. À variável args é um arranjo de objetos 
String; ou seja, uma coleção de strings indexadas, com a primeira string sendo args[0], a segunda 
sendo args[1] e assim por diante, (Falaremos mais sobre arranjos na Seção 1.5.) 


Chamando um programa Java a partir da linha de comando 


Programas Java podem ser chamados a partir da linha de comando usando o comando Java se- 
guido do nome da classe Java que contém o método main que se deseja executar, mais qualquer 
argumento opcional, Por exemplo, o programa Aquarium poderia ter sido definido para receber 
um parámetro opcional que especificasse o número de peixes no aquário. O programa poderia ser 
ativado digitando-se o seguinte em uma janela Shell: 

java Aquarium 45 


para especificar que se quer um aquário com 45 peixes dentro dele. Neste caso, args[0] se refere à 
string "45", Uma característica interessante do método main é que permite a cada classe definir 
um programa executável, e um dos usos deste método é testar os outros métodos da classe. Desta 
forma, o uso completo do método main é uma ferramenta eficaz para a depuração de coleções de 
classes Java. 


Blocos de comandos e variáveis locals 


O corpo de um método é um bloco de comandos, ou seja, uma sequência de declarações e co- 
mandos executáveis definidos entre chaves "(^ e "|". О corpo de um método е outros blocos 
de comandos podem conter também blocos de comandos aninhados. Além de comandos que 
executam uma ação, tal como ativar um método de algum objeto, os blocos de comandos podem 
conter declarações de varidveis locais, Essas vanáveis são declaradas no corpo do comando, em 
geral no início (mas entre as chaves "[" e “PL As variáveis locais são similares a variáveis de 
instância. mas existem apenas enquanto o bloco de comandos está sendo executado. Tão logo o 
Muxo de controle saia do bloco, todas as variáveis locais internas do mesmo não podem mais ser 
referenciadas. Uma variável local pode ser tanto um tipo base (tal como int, float, double), como 
uma referência para uma mstância de alguma classe. Comandos e declarações simples em Java 
sempre se encerram com ponto-e-vírgula, ou seja um "7". 

Existem duas formas de declarar variáveis locals: 

Hpo nome; 

tipa nome = valor. inicial; 


A primeira declaração simplesmente define que o identificador, nome, ё de um upo especifico. 
A segunda declaração define o identificador, seu tipo e também inicializa a variável com um 
alor específico, Seguem alguns cxemplos de inicialização de variáveis locais: 
{ 

double г; 

Point p1 = new Point (3, 4); 

Point p2 = new Point (8, 2); 

int i = 512; 

double e = 2.71828; 
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1.3 Expressões 


Variáveis е constantes são usadas em expressões para definir novos valores e para modificar 
variáveis. Nesta seção, discute-se com mais detalhes como as expressões Java funcionam. Elas 
envolvem o uso de literais, variáveis e operadores. Como as variáveis já foram examinadas, se- 
rão focados rapidamente os literais e analisados os operadores com mais detalhe. 


1.3.1 


1.3.2 


Literais 


Um literal é qualquer valor “constante” que pode ser usado em uma atribuição ou outro tipo de 
expressão, Java admite os seguintes tipos de literais; 


* A referência para objeto null (este é a único literal que é um objeto e pertence à classe 

genérica Object por definição). 

Booleano: true е false, 

Inteiro; o default para um inteiro como 176 ou -52 é ser do tipo int, que corresponde a um 
inteiro de 32 bits. Um literal representando um inteiro longo deve terminar por um "L" ou 
"T", por exemplo, 176L ou -521, e corresponde a um inteiro de 64 bits, 

* Ponto flutuante: o default para números de ponto flutuante, tais como 3.1415 e 10035.23, 
é ser do tipo double. Para especificar um literal float, ele deve terminar por um "F^ou um 
"f". Literais de ponto flutuante em notação exponencial também são aceitos, como por 
exemplo, 3.14E2 ou 0,19810; a base assumida é 10. 

* Caracteres: assume-se que constantes de caracteres em Java pertencem ao alfabeto Unico- 
de. Normalmente, um caractere é definido como um símbolo individual entre aspas sim- 
ples. Por exemplo, 'a' e "7" são constantes caractere. Além desses, Java define as seguintes 
constantes especiais de caracteres: 


^n' (nova linha) "t (tabulação) 

“El (retorna um espaço) "«r' (retorno do carro) 
“EO (alimenta formulário) ^A (barra invertida) 
"w^ (aspas simples) tt (aspas duplas) 


e Strings: uma string é uma sequência de caracteres entre aspas duplas, por exemplo, o que 
segue é um string literal 


"cachorros não sobem em árvores" 


Operadores 
As expressões em Java implicam em concatenar literais е variáveis usando operadores. Os opera- 
dores de Java serão analisados nesta seção. 
Q operador de atribuição 


O operador-padräo de atribuição em Java é "=". É usado na atribuição de valores para variáveis 
de instância ou vartáveis locais. Sua sintaxe é: 


varidvel = expressão 
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onde varidvel se refere a uma variável que pode ser referenciada no bloco de comandos que contém 
esta expressão. O valor de uma operação de atribuição é o valor da expressão que é atribuída. Sendo 
assim, se | e | são declaradas do tipo int, é correto ter um comando de atribuição como o seguinte: 


i= j= 25; M funciona porque o operador '=' é avaliado da direita para a esquerda 


Operadores aritméticos 
Os operadores que seguem são os operadores binários aritméticos de Java: 
+ adição 
— subtração 
* multiplicação 
! divisão 


"b operador módulo 


O operador módulo também é conhecido como o operador de "resto", na medida em que 
fornece o resto de uma divisão de números inteiros. Com frequéncia, usamos “mod” para indicar 
o operador de módulo, e o definimos formalmente como: 


n mod m = F 
de maneira que 
п = т + 


para um inteiro g e 0 = г < м. 

Java também fornece o operador unário menos (—), que pode ser colocado na frente de 
qualquer expressão aritmética para inverter seu sinal, É possível utilizar parênteses em qualquer 
expressão para definir a ordem de avaliação. Java utiliza ainda uma regra de precedência de ope- 
radores bastante intuitiva para determinar a ordem de avaliação quando não são usados parênte- 
ses. Ao contrário de C++, Java não permite a sobrecarga de operadores. 


Operadores de incremento e decremento 


Da mesma forma que C e C++, Java oferece operadores de incremento e decremento. De forma 
mais específica, oferece os operadores incremento de um (++) e decremento de um (——). Se 
tais operadores são usados na frente de um nome de variável, então | é somado ou subtraído à va- 
riável, e seu valor é empregado na expressão. Se for utilizado depois do nome da variável, então 
primeiro o valor é usado, e depois a variável é incrementada ou decrementada de 1, Assim, por 
exemplo, o trecho de código 


int i — 8; 

int j = i++: 
int k = ++i; 
int m = i——; 
intn 58 + i++; 


atribui 8 para j, 10 para k, 10 para m, 18 para n e deixa i com o valor 10, 


Operadores lógicos 
Java oferece operadores padrão para comparações entre números: 


< menor que 
<= menor que ou igual a 
== igual a 
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1= diferente de 
>= maior que ou igual a 
- maior que 


Os operadores == e != também podem ser usados com referências para objetos, O tipo resul- 
tante de uma comparação é boolean. 
Os operadores que trabalham com valores boolean são os seguintes: 

! — negacáo (prefixado) 

dk econdicional 

|| ou condicional 
Os operadores booleanos && e | | não avaliação o segundo operando em suas expressões (para a 
direita) se isso não for necessário para determinar o valor da expressão. Este recurso é útil, por 
exemplo, para construir expressões booleanas onde primeiro se testa se uma determinada condi- 
cão se aplica (tal como uma referência não ser null) e, então, se testa uma condição que geraria 
uma condição de erro, se o primeiro teste falhasse. 


Operadores sobre bits 


Java fornece, também, os seguintes operadores sobre bits para inteiros e booleanos: 


n= complemento sobre hits (operador prefixado unário) 
de e sobre bits 

| ou sobre hits 

^ ou exclusivo sobre bits 


= deslocamento de bits para esquerda, preenchendo com zeros 
>> deslocamento de bits para a direita, preenchendo com bits de sinal 
>>> deslocamento de bits para a direita, preenchendo com zeros 


Operadores operacionais de atribuição 


Além do operador de atribuição padrão (=), Java também oferece um conjunto de outros operadores 
de atribuição que têm efeitos colaterais operacionais. Esses outros tipos de operadores são da forma: 


varidvel op = expressão 
onde op é um operador binário, Esta expressão é equivalente a 

varidvel = varidvel op expressão 
excetuando-se que, se varidvel contém uma expressão (por exemplo, um índice de arranjo), а 
expressão é avaliada apenas uma vez. Assim, o fragmento de código 


a[5] = 10; 
|æ 5 
аў» +] += 2; 


deixa a[5] com o valor 12 ei com o valor б. 


Concaten acao de strings 
As strings podem ser compostas usando o operador de concatenação (+), de forma que o código 
String rug = "carpet"; 
string dog = "spot", 
String mess = rug + dog; 
String answer = mess + "will cost me" + 5 + "dollars! "| 
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terá o efeito de fazer answer apontar para a string 
"carpetspot will cost me 5 dollars!" 


Esse exemplo também mostra como Java converte constantes que não são string em strings, 
quando estas estão envolvidas em uma operação de concatenação de strings. 


Precedência de operadores 


Os operadores em Java têm uma dada preferência, ou precedência, que determina a ordem na 
qual as operações são executadas quando a ausência de parênteses ocasiona ambigüidades na 
avaliação. Por exemplo, é necessário que exista uma forma de decidir se a expressão "5«2*3" 
tem valor 21 ou 11 (em Java o valor é 11), 

A Tabela 1.3 apresenta a precedência dos operadores em Java (que, coincidentemente, é а 
mesma de C). 


operadores pös-Tixados | exp ++ exp -- 
operadores pré-fixados | ++exp — — exp +exp —exp exp leap 
cast (coercáo) 


ADA UA 


3 
Lr + 


ULL 


12 | condicional expressão booleana? valor se true : valor se 
atribuição = +=- #ш [ш dm >>= <ca>>>=g= "= 


Tabela 1.3 As regras de precedência de Java. Os operadores em Java são avaliados de acordo 
com a ordem acima se não forem utilizados parênteses para determinar a ordem de avaliação. Os 
operadores na mesma linha são avaliados da esquerda para a direita (exceto atribuições e operações 
prefixadas, que são avaliadas da direita para esquerda), sujeitos à regra de avaliação condicional 
para as operações booleanas e e ou. Às operações são listadas da precedência mais alta para a mais 
baixa (usamos exp para indicar uma expressão atômica ou entre parênteses), Sem parênteses, os 
operadores de maior precedência são executados depois de operadores de menor precedência. 


z 
E 
Ea 
ил 
FE 
_ 8. 
BER 
EI 
EH 


Discutiu-se até agora quase todos os operadores listados na Tabela 1.3. Uma exceção notável 
é o operador condicional, o que implica avaliar uma expressão booleana e então tomar o valor 
apropriado, dependendo de a expressão booleana ser verdadeira ou falsa. (O uso do operador 
instanceof será analisado no próximo capitulo.) 


133 Conversores e autoboxing/unboxing em expressões 


A conversão é uma operação que nos permite alterar o tipo de uma variável. Em essência, pode- 
se converter uma variável de um tipo em uma variável equivalente de outro tipo, Os conversores 
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A ———— ee = =m: — mr = Lu a 


podem ser úteis para fazer certas operações numéricas e de entrada e saída. A sintaxe para con- 
verter uma variável para um tipo desejado é a seguinte: 


(ripe) exp 


onde tipo é o tipo que se deseja que a expressão exp assuma. Existem dois tipos fundamentais de 
conversores que podem ser aplicados em Java. Pode-se tanto converter tipos de base numérica 
como tipos relacionados cam objetos, Agora, será discutida a conversão de tipos numéricos с 
strings e a conversão de objetos será analisada na Seção 2.5.1. Por exemplo, pode ser útil conver- 
ter um int em um double de maneira a executar operações como uma divisão, 


Conversores USUAIS 


Quando se converte um double em um int, pode-se perder a precisão. Isso significa que o valor 
double resultante será arredondado para baixo. Mas pode-se converter um int em um double sem 
esta preocupação. Por exemplo, considere o seguinte: 


double di = 3.2; 

double d2 = 3,9999; 

int il = (int)d1; #11 tem valor 3 
int i2 = (int)d?2; Й 12 tem valor 3 


double аз = (doubleji2;  //d3 tem valor 3.0 


Convertendo operadores 


Alguns operadores binários, como o de divisão, terão resultados diferentes dependendo dos tipos 
de variáveis envolvidas. Devemos ter cuidado para garantir que tais operações executem seus 
cálculos em valores do tipo desejado. Quando usada com inteiros, por exemplo, a divisão não 
mantém a parte fracionária. No caso de uso com double, à divisio conserva esta parte, como 
ilustra o exemplo a seguir: 


int i1 = 3; 
int і2 = 6; 
dresult = (double) / (double)i2; —//dresult tem valor 0.5 
dresult — i1 / i2; ff dresult tem valor 0.0 


Observe que a divisão normal para números reais foi executada quando i1 e i2 foram conver- 
tidos em double, Quando i1 e i2 não foram convertidos, o operador © / ” executou uma divisão 
inteira e o resultado de i1 / iz foi o int 0, Java executou uma conversão implicita para atribuir um 
valor int ao resultado double. Vamos estudar a conversão implícita a seguir. 


Conversores implicitos e autoboxing/unboxing 


Existem casos onde o Java irá executar uma conversão implícita, de acordo com o tipo da variá- 
vel sendo atribuida, desde que não haja perda de precisão, Por exemplo: 


int iresult, i = 3; 
double dresult, d = 3.2; 


dresult = i / d; // dresult tem valor 0.9375. i foi convertido para double 
iresult = id; ff perda de precisão -> [sso é em um erro de compilação; 
result = (int) i / d; /! iresult é 0, uma vez que a parte fracionária será perdida. 


Considerando que Java não executará conversões implícitas onde houver perda de precisão, a 
conversão explicita da última linha do exemplo é necessária. 

A partir do Java 5.0, existe um novo tipo de conversão implícita entre objetos numéricos, tais 
como Integer e Float, e seus tipos básicos relacionados, tais como int e float. Sempre que um ob- 
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jeto numérico for esperado como parâmetro para um método, o tipo básico correspondente pode 
ser informado. Neste caso, o Java irá proceder uma conversão implicita chamada autoboxing, 
que irá converter o tipo base para o objeto numérico correspondente. Da mesma forma, sempre 
que um tipo base for esperado em uma expressão envolvendo um objeto numérico, o objeto nu- 
mérico será convertido no tipo base correspondente em uma operação chamada de unboxing. 

Existem, entretanto, alguns cuidados a serem tomados no uso de boxing e unboxing. O pri- 
meiro é que se uma referência numérica for null, então qualquer tentativa de unboxing irá ge- 
rar um erro de NullPointerException. Em segundo, o operador “==" é usado tanto para testar 
a igualdade de dois valores numéricos como se duas referências para objetos apontam para o 
mesmo objeto. Sendo assim, quando se testa a igualdade, deve-se evitar a conversão implícita 
provida por autoboxing/unboxing. Por fim, a conversão implícita de qualquer tipo toma tempo, 
logo devemos minimizar nossa confiança nela se performance for um requisito. 

Cinrcunstancialmente, existe uma situação em Java em que apenas a conversão implícita é 
permitida, que € na concatenação de strings. Sempre que uma string é concatenada com qualquer 
objeto ou tipo base, o objeto ou tipo base é automaticamente convertido em uma string. Entretan- 
to, a conversão explícita de um objeto ou tipo base para uma string não é permitida. Portanto, as 
seguintes atribuições são incorretas: 


String 5 = (String) 4.5; (isso está errado! 
String! = "Value = * + (String) 13; // Isso está errado! 
String u = 22; H Isso está errado! 


Para executar conversóes para string, deve-se, ao invés disso, usar o método toString apro- 
priado ou executar uma conversão implícita via operação de concatenação. Assim, os seguintes 
comandos estão corretos: 

Strings = "= + 4.5; ff correto, porém, mau estilo de programação 
String t = "Value = " + 13; coreto 
String u = Integer.toString(22); // correto 


1.4 Controle de fluxo 


O controle de fluxo em Java é similar ao oferecido em outras linguagens de alto nível. Nesta 
seção, revisa-se a estrutura básica e a sintaxe do controle de fluxo em Java, incluindo retorno 
de métodos, comando condicional, comandos de seleção múltipla, laços e formas restritas de 
“desvios” (os comandos break e continue). 


1.4.1 Os comandos if e switch 
Em Java, comandos condicionais funcionam da mesma forma que em outras linguagens. Eles 
fornecem a maneira de tomar uma decisão e então executar um ou mais blocos de comandos 
diferentes baseados no resultado da decisão. 


O comando if 


A sintaxe básica do comando if é a que segue: 


if (expr. booleana) 
comando se verdade 
else 
commamdo se falso 
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onde expr booleana é uma expressão booleana € comando se verdade € comando se falso podem 
ser um comando simples ou um bloco de comandos entre chaves ("[" e *]%), Observa-se que, di- 
ferentemente de outras linguagens de programação, os valores testados por um comando if devem 
ser uma expressão booleana. Particularmente, não são uma expressão inteira, Por outro lado, como 
em outras linguagens similares, a cláusula else (e seus comandos associados) são opcionais. Existe 
também uma forma de agrupar um conjunto de testes booleanos como segue: 


if (primeira expressão booleana) 
comando se verdade 

else if (segunda expressão booleana) 
segundo comando se verdade 

else 
comando se falso 


Se a primeira expressão booleana for falsa, entáo a segunda expressão booleana será testada, e 
assim por diante. Um comando if pode ter qualquer quantidade de cláusulas else if. 
Por exemplo, a estrutura à seguir está correta: 


if (snowLevel < 2) ( 
goToClass( |; 
comeHomed |: 

| 

else if (snowLevel < 5) [ 
goSledding! ); 
haveSnowballFightl |; 

| 

else 
stayAtHomel }; 


Comando switch 


Java oferece o comando switch para controle de fluxo multivalorado, o que é especialmente útil 
com tipos enumerados. O exemplo a seguir é indicativo (bascado na variável d do tipo Day da 
Seção 1.1.3). 


switch (d) | 

case MON: 
Systern.out.prinin This is tough."} 
break; 

case TUE: 
Systern out. printin("This is getting better, "|; 
break; 

case WED: 
System.out.printin(^Half way there." 
break: 

case THU: 
System.out.printin["I can see the light. "); 
break; 

case FAL 
System.out.printin(" Row we are talking. "|; 
break: 

default: 
System.out.prntün("Day off!" 
break: 
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O comando switch avalia uma expressão inteira ou enumeração e faz com que o fluxo de 
controle desvie para o ponto marcado com o valor dessa expressão, Se não existir um ponto com 
tal marca, então o fluxo é desviado para o ponto marcado com “default”. Entretanto, este É o 
único desvio explicito que o comando switch executa, e, a seguir, o controle "car" através das 
cláusulas case se o código dessas cláusulas não for terminado por uma instrução break (que faz 
o fluxa de controle desviar para a próxima linha depois do comando switch). 


1.442 Lagos 


Outro mecanismo de controle de fluxo importante em uma linguagem de programação é o laço. 
Java possui trés tipos de laços. 


Laços while 


O tipo mais simples de laço em Java é o laço while, Este tipo de laço testa se uma certa condição 
é satisfeita e executa o corpo do lago enquanto esta condição for true. À sintaxe para testar uma 
condição antes de o corpo do laço ser executado é a seguinte: 


while (expressão booleana) 
corpo de laco 


No inicio de cada iteração, o lago testa à expressão booleana, boolean exp, e então, se esta re- 
sultar true, executa o corpo do laço, loop statement, Da mesma forma que o laço for, o corpo do 
laço também pode ser um bloco de comandos. 

Considere-se, por exemplo, um gnomo tentando regar todas as cenouras de seu canteiro de 
cenouras, o que faz até seu regador ficar vazio. Se o regador estiver vazio logo no Início, escreve- 
se o código para executar esta tarefa como segue: 


public void waterCarrots/) [ 
Carrot current = garden.findNextCarrot (y; 


while ('waterCan.isEmpty ( )) { 
water (current, waterCan); 
current = garden.findMextCarrot ( |; 


Lembre-se que 


[T LL] 


em Java é o operador "nat". 


Laços for 

Outro tipo de laço é o laço for. Na sua forma mais simples, os laços for oferecem uma repetição 
codificada baseada em um índice inteiro, Em Java, entretanto, pode-se fazer muito mais. A fun- 
cionalidade de um laço for é significativamente mais Mexivel, Sua estrutura se divide em quatro 
seções: inicialização, condição, incremento e corpo. 

Definindo um laço for 

Esta é a sintaxe de um laço for em Java 


for (inicialização; condição; incremento) 
corpo do lago 


onde cada uma das seções de inicialização, condição e incremento podem estar vazias, 
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Na seção inicialização, pode-se declarar uma variável índice que será válida apenas no esco- 
po do laço for, Por exemplo, quando se deseja um laço indexado por um contador, e não há ne- 
cessidade desse contador fora do contexto do laço for, então declara-se algo como o que segue 


for (int counter = 0; condição; incremento) 
corpo do laco 


que declara uma variável counter cujo escopo é limitado apenas ao corpo do laço. 

Na seção condição, especifica-se a condição de repetição ("enquanto") do laço, Esta deve ser 
uma expressão booleana. O corpo do lago for será executado toda a vez que a condição resultar 
true, quando avaliada no inicio de uma iteração potencial. Assim que a condição resultar false, 
então o corpo do laço não será executado e, em seu lugar, o programa executa o próximo coman- 
do depois do laço for. 

Na seção de incremento, declara-se o comando de incremento do lago, O comando de incre- 
mento pode ser qualquer comando válido, o que permite uma flexibilidade significativa para a 
programação. Assim, a sintaxe do laço for é equivalente ao que segue: 

inicialização; 

while (condicio) | 

comandos do lago 
ERC PEIES, 


| 


exceto pelo fato de que um laço while não pode ter uma condição booleana vazia, enquanto que 
um laço for pode, O exemplo a seguir apresenta um exemplo simples de laço for em Java: 


publi void eatApples (Apples apples) { 
numApples = apples.getNumApples ( ); 
for (int = = 0; x < numApples; <+>+) | 
eatApple (apples.getApple (x); 
spitOutCore ( ); 


| 


Neste exemplo, a variável de laço * foi declarada como int x = 0, Antes de cada iteração, o 
lago testa a condição “x < numApples" e executa o corpo do lago apenas se isso for verdadeiro, 
Por último, ao final de cada iteração, o laço usa a expressão х + + para incrementar a variável х 
do laço antes de testar a condição novamente. 

Desde a versão 5.0, Java inclui o lago for-each, que será discutido na Seção 6.3.2. 


Laços do-while 


Java tem ainda outro tipo de lago além do lago for e do laço while padrão — o laço do-while. 
Enquanto que os primeiros testam a condição antes de executar a primeira iteração com o corpo 
do lago, o laço do-while testa a condição após o corpo do lago. A sintaxe de um lago do-while é 
mostrada à seguir: 


do 
corpo do laço 
while (condição) 


Mais uma vez, o corpo do laco pode ser um comando ou um bloco de comandos, e a condi- 
cão será uma expressão booleana. Em um laço do-while, repete-se o corpo do laço enquanto a 
expressão resultar verdadeira a cada avaliação. 

Suponha-se, por exemplo, que se deseja solicitar uma entrada ao usuário e posteriormente 
fazer algo ütil com essa entrada. (Entradas e saídas em Java serão examinadas com mais detalhes 
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na Seção 1,6.) Uma condição possível para sair do lago, neste caso, é quando o usuário entra uma 
string vazia. Entretanto, mesmo neste caso, pode-se querer manter a entrada e informar ao usuá- 
no que ela saiu. O exemplo a seguir ilustra o caso; 
public void getlserinput( ) [ 
String input; 
do { 
input = getlnputstringt ): 
handlelngutingut); 
} while (input.lengthi }>0); 
| 
Observe-se a condição de saída do exemplo, Mais especificamente, está escrita para ser con- 
sistente com a regra de Java que diz que laços do-while se encerram quando a condição mão é 
verdadeira (30 contrário da construção repeat-until usada em outras linguagens). 
1.4.3 Expressões explicitas de controle de fluxo 


Java também oferece comandos que permitem alterações explícitas no fluxo de controle de um 
programa 


Retornando de um metodo 


^e um método Java é declarado com o tipo de retorno void, então o fluxo de controle retorna 
quando encontra a última linha de código do método ou quando encontra um comando return 
sem argumentos. Entretanto, se um método é declarado com um tipo de retorno, ele € uma fun- 
ção e deverá terminar retornando o valor da função como um argumento do comando return. O 
exemplo seguinte (correto) idustra o retorno de uma função: 


і! Verifica um aniversário específico 
public boolean checkBDay (int date) [ 
if (date = = Birthday.MIKES BDAYY 

return true; 


] 
return false: 


! 


Conclui-se que o comando return deve ser o último comando executado em uma função, Já que 
o resto do código nunca será alcançado, 

Existe uma diferença significativa entre um comando ser a última linha de código a ser exe- 
cutada em um método ou ser a última linha de código do método propriamente dita. No exemplo 
anterior, à linha return true; claramente não é a última linha do código escrito para a função, 
mas pode ser a última linha executada (se a condição envolvendo date for true). Esse comando 
interrompe de forma explícita o fluxo de controle do método. Existem dois outros comandos ex- 
plicitos de controle de fluxo que são usados em conjunto com laços e com o comando switch. 


O comando break 
Ü uso típico do comando break tem a seguinte sintaxe simples: 
break; 


E usado para “sair” do bloco internamente mais aninhado dos comandos switch, for, while ou 
do-while. Quando executado, um comando break faz com que o fluxe de controle seja desviado 
para a próxima linha depois do laço ou switch que contém o break. 
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O comando break também pode ser usado de forma rotulada para desviar para o laço ou 
comando switch de aninhamento mais externo. Neste caso, ele tem a sintaxe: 


break fabel: 


onde label é um identificador em Java usado para rotular um lage ou um comando switch. Este 
tipo de rótulo só pode aparecer no início da declaração de um laço; não existem outras formas de 
comandos “go to" em Java. 

O uso de um rótulo com comando break é ilustrado no seguinte exemplo: 


public static boolean has ZeroEntry (nti ][] a) { 
boolean foundFlag = false; 


zeroSearch: 
for (int i- 0; ¡<a length; i++) 
for (int j=0; jx ali) length; [+ +] { 
и (а[]] == QM 
foundFlag — true; 
break zeroSearch; 


} 
return foundrlag; 


O exemplo acima usa arranjos que serão abordados na Seção 3.1 


O comando continue 


O outro comando que altera explicitamente o fluxo de controle em um programa Java é o coman- 
do continue, que tem à seguinte sintaxe: 


continue label 


onde label é um identificador em Java usado para rotular o lago, Como já for mencionado an- 
leriormente, não existem comandos “go to" explícitos em Java, Da mesma forma, o comando 
continue só pode ser usado dentro de laços (for, while e do-while). O comando continue faz 
com que a execução pule os passos restantes do laço na iteração atual (mas continue o laço se a 
condição for satisfeita). 


1.5 Arranjos 


Uma tarefa comum em programação é a manutenção de um conjunto numerado de objetos re- 
lacionados. Por exemplo, deseja-se que um jogo de videogame mantenha a relação das dez me- 
Ihores pontuações. Em vez de se usar dez variáveis diferentes para esta tarefa, prefere-se usar 
um único nome para o conjunto e usar índices numéricos para referenciar as pontuações mais 
altas dentro do conjunto. Da mesma forma, deseja-se que um sistema de informações médicas 
mantenha a relação de pacientes associados aos leitos de um certo hospital. Novamente, não é 
necessário inserir 200 variáveis no programa apenas porque o hospital tem 200 leitos, 

Nestes casos, minimiza-se o esforço de programação pelo uso de arranjos, que são coleções 
numeradas de variáveis do mesmo tipo. Cada variável ou cétula em um arranjo tem um Índice, 
que referencia o valor armazenado na célula de forma única. As células de um arranjo a são nu- 
meradas 0, 1, 2 e assim por diante. A Figura 1.6 apresenta o desenho de um arranjo contendo as 
melhores pontuações do videogame. 
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Figura 1.6 Desenho de um arranjo com as dez (int) melhores pontuações de um videogame. 


Essa forma de organização é extremamente útil, na medida em que permite computações 
interessantes. Por exemplo, o método a seguir soma todos os valores armazenados em um arranjo 
de inteiros: 


/** Soma todos os valores de um arranjo de inteiros */ 

public static int sumiin [| a) [ 

int total = O 

for (int i=0; iza length; i++) // observe-se o uso da variável length 
total += ali; 

return total, 

| 


Este exemplo tira vantagem de um recurso interessante de Java que permite determinar a 
quantidade de células mantidas por um arranjo, ou seja, seu manhe”, Em Java um arranjo a é 
um tipo especial de objeto, e o tamanho de a está armazenado na variável de instância length. Isto 
É, jamais será necessário ter de adivinhar o tamanho de um arranjo em Java, visto que o tamanho 
de um arranjo pode ser acessado como segue: 


nome do arranjo length 


onde nome. do arranjo É o nome do arranjo. Assim, às células de um arranjo a são numeradas 0, 
1, 2, e assim por diante até a length — 1. 


Elementos e capacidade de um arranjo 


Cada objeto armazenado em um arranjo é chamado de elemento do arranjo. O elemento nüme- 
ro 0 é a[U], o elemento número 1 é all]. o elemento número 2 é a[2]. e assim por diante. Uma 
vez que o comprimento de um arranjo determina o nümero máximo de coisas que podem ser 
armazenadas no aranjo, também pode-se referir ao comprimento de um arranjo como sendo sua 
capacidade. O trecho de código que segue apresenta outro exemplo simples de uso de arranjos, 
que conta o número de vezes que um certo número aparece em um arranjo. 


/** Conta o número de vezes que um inteiro aparece em um arranjo */ 
public static int findCount(nt[] a. int К} ( 

int count = 0; 

for (int e: a) [ ff observe-se o uso do laço “foreach” 

Wf {e == К) l/daeva-se verificar se o elemento corrente é igua a К 
count; 
} 
return count; 


! 


Erros de limites 


É um erro perigoso tentar indexar um arranjo a usando um número fora do intervalo de O a 
a length — 1. Tal referencia é dita estar fora de faixa, Referências fora de faixa tem sido fre- 


= N. de T. Apesar dà expressão em imgles dengti indicar compr menta, € mais COMUM entre programades Java à uso da enpres- 
sho tamen do arcanje. 


qiientemente exploradas por hackers usando um método chamado ataque do estouro do buffer" 
comprometendo a segurança de sistemas de computação escritos em outras linguagens em vez 
de Java. Por questões de segurança, os índices de arranjo são sempre verificados em Java para 
constatar se não estão fora de faixa. Se um Índice de arranjo está fora de faixa, o ambiente de exe- 
cução de Java sinaliza uma condição de erro. O nome desta condição é ArraylndexOutOfBoun- 
dsExceptions. Esta verificação auxilia para que Java evite uma série de problemas (incluindo 
problemas de ataque de estouro de buffer) com os quais outras linguagens tem de lutar. 

Pode-se evitar erros de indice fora de faixa tendo certeza de que as indexações sempre serão 
feitas dentro de um arranjo a, usando valores inteiros entre 0 e a.length. Uma forma simples de 
fazer isso é usando com cuidado o recurso das operações booleanas de Java já apresentado. Por 
exemplo, um comando como o que segue nunca irá gerar um erro de índice fora de faixa: 

if (( >= 0) && (i = a.length) && (a[i] > 24) 

x = ali} 
pois a comparação “ali) > 5" só será executada se as duas primeiras comparações forem bem- 
sucedidas, 


1.5.1 Declarando arranjos 
Uma forma de declarar e inicializar um arranjo é a seguinte: 
tipo do elemento(| nome do arranje = | val_ínic_0, val_inic_1,.... val_inic_N-] |; 


О про do elemento pode ser qualquer tipo base de Java ou um nome de classe e nome do ar- 
ranjo pode ser qualquer identificador Java válido. Os valores de inicialização devem ser do mes- 
mo tipo que o arranjo. Por exemplo, considere-se a seguinte declaração de um arranjo que é 
inicializado para conter os primeiros dez números primos: 


int] ] primes = (2, 3, 5, 7, 11, 13, 17, 19, 23, 29); 

Além de declarar um arranjo e inicializar todos os seus valores na declaração, pode-se decla- 
rar um arranjo sem inicializá-lo, A forma desta declaração é a que segue: 

tipo do elemento|] nome do arrange: 


Um arranjo criado desta forma é inicializado com zeros se o tipo do arranjo for um tipo nu- 
mérico. Arranjos de objetos são inicializados com referências null. Uma vez criado um arranjo 
desta forma, pode-se criar o conjunto de células mais tarde usando a sintaxe a seguir: 


new tipo do elementolcomprimento] 


onde comprimento é um inteiro positivo que denota o comprimento do arranjo criado. Normal- 
mente, esta expressão aparece em comandos de atribuição com o nome do arranjo do lado es- 
querdo do operador de atribuição. Então, por exemplo, o seguinte comando define uma variável 
arranjo chamada e e, mais larde, atribuem-se à mesma um arranjo de dez células, cada uma do 
tipo double, que então é inicializado: 


double[ ] a: 

// ... магов passos ... 

а = new double[10], 

for (int k=0; k < a.length; k++} ( 
alk] = 1.0; 

] 


Rm 


* M. de T. Em inglés, buffer averlo attack, 
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As células do novo arranjo “a” são indexadas usando o conjunto inteiro [0,1,2, … 9) (lem- 
bre-se que os arranjos em Java sempre iniciam a indexação em 0), e, da mesma forma que qual- 
quer arranjo Java, todas as células deste arranjo são do mesmo tipo — double. 


1.5.2 Arranjos são objetos 


Arranjos em Java são pos especiais de objetos. Na verdade, esta é a razão pela qual pode-se usar 
o operador new para criar uma nova instância de arranjo, Um arranjo pode ser usado da mesma 
forma que qualquer outro objeto de Java, mas existe uma sintaxe especial (usando colchetes, 
"[ e *]% para se referenciar a seus membros. Um arranjo Java pode fazer tudo que um objeto 
genérico pode fazer. Como se trata de um objeto, o nome de um arranjo em Java é, na verdade, 
uma referência para o lugar na memória onde o arranjo está armazenado. Assim, não existe nada 
de tão especial em se usar o operador ponto € à variável de instância length, para se referir ao 
comprimento de um arranjo como no exemplo "a.length”. O nome a. neste caso, É apenas uma 
referência ou ponteiro para o arranjo subjacente. 

O fato de que arranjos em Java são objetos tem uma implicação importante quando se usa 
nomes de arranjos em expressões de atribuição. Quando se escreve algo tal como 


е 


Б = а; 
cm um programa Java, па verdade significa que agora tanto b como a se referem ao mesmo ar- 
ranjo. Então, ao se escrever algo como 

b[3] = 5; 


se está alterando a[3] para 5. Este ponto crucial é demonstrado na Figura 1.7. 


“= [940] 880 [830 [790 [750 [660 [650 [590 | 510 | 440. 
b 0 1 2 5 8 7 8 9 
Alteração 
resultante 
da atribuição 


"  b[3]=5; 


“> [sso[asoJe3o] s [750[660[650[590[510]440] 
b—7 Q0 14 2 3 4 5 6 7 В 9 


Figura 1.7 Desenho da atribuição de um arranjo de objetos. Apresenta-se o resultado da atri- 
buição de “b(3] = 5;" depois de previamente ter executado "b = a". 


Clonando urn arranjo 
Se, por outro lado, for necessário criar uma cópia exata do arranjo a e atribuir esse arranjo para a 
variável arranjo b. pode-se escrever: 

b = a.clione(); 
que copia todas as células em um novo arranjo e o atribui a b. de maneira que este арома para о 
novo arranjo. Na verdade, o método clone é um método predefinido de todo objeto Java, e cria 
uma cópia exata de um objeto, Neste caso, se então escrever-se 

b(3] = 5; 


o novo arranjo (copiado) terá o valor 5 atribuido para a célula de índice 3, mas a[3] irá permane- 
cer inalterado, Demonstra-se esta situação na Figura 1.8. 
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a — [940 | 880 | 830 | 790 | 750 | 660 | 650] 590] 510 | 440. 
0 1 2 3 4 5 Ë г B 9 
b— [940 |880 |830 | 790 | 750 | 660 650 | 590 | 510 | 440 | 
0 1 2 3 4 5 8 7 8 9 
Alteração 
і originária da 
| atribuição 
T b[325 


a — |940 880 830 | 790 | 750 | 660 | 650 | 590 | 510 | 440. 
0 1 2 3 4 5 6 T 8 9 

b—— |940 [880 [830 | 5 | 750 |660 |650 | 590 |510 |440 
0 1 2 3 4 5 6 т 8 9 


Figura 1.8 Demonstração da clonagem de um arranjo de objetos. Demonstra-se o resultado da 
atribuicào b[3] = 5 após a atribuição "b = a.clone( );”. 


Detalhando, pode-se afirmar que as células de um arranjo são copiadas quando o mesmo é chr- 
nado, Se as células são de um tipo base, como int, os valores são copiados. Mas se as células são ге- 
ferências para objetos, então essas referências são copiadas. 1950 significa que existem duas maneiras 
de referenciar tais objetos. As consequências deste fato são exploradas no Exercicio R-1.1. 


1.6 Entrada e saída simples 


Java oferece um conjunto rico de classes e métodos para executar entrada e saída. Existem classes 
para executar projetos de interfaces gráficas com o usuário, incluindo diálogos e menus suspen- 
sos, assim como métodos para a exibição e a entrada de texto e números. Java também oferece 
métodos para lidar com objetos gráficos, imagens, sons, páginas Web e eventos de mouse (tais 
como cliques, deslocamentos do mouse e arrasto). Além do mais, muitos desses métodos de en- 
trada e saída podem ser usados tanto em programas executáveis como em applets. Infelizmente, 
detalhar como cada um desses métodos funciona para construir interfaces gráficas sofisticadas 
com o usuário está além do escopo deste livro. Entretanto, em nome de uma maior abrangência, 
descreve-se nesta seção como se pode fazer entrada e saída simples em Java. 

Em Java, a entrada e saída simples é feita através da janela console de Java. Dependendo do 
ambiente Java que se está empregando, esta janela pode ser a janela especial usada para exibição е 
entrada de texto, ou é a janela que se utiliza para passar comandos para nosso sistema operacional 
(tais janelas costumam ser chamadas de janelas de console, janelas DOS ou janelas de terminal). 


Métodos de saida 


Java oferece um objeto static embutido chamado System.out, que envia a saída para o dis- 
positivo de saída-padráo. Alguns sistemas operacionais permitem aos usuários redirecionar 
a sadda-padrão para arquivos ou até mesmo como entrada para outros programas, embora а 
salda-padräo seja a janela de console de Java. O objeto System.out é uma instância da classe 
java.io.PrintStream. Essa classe define métodos para um fluxo buferizado de saída, o que sig- 
nifica que os caracteres são colocados em uma localização temporária, chamada buffer. que € 
esvaziada quando a jangla de console estiver pronta para imprimir os caracteres. 
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Mais especificamente, a classe java io.PrintStream fornece os seguintes métodos para execu- 
tar saídas simples (usamos base. гуре para indicar qualquer um dos possíveis tipos básicos): 


print(Object o): imprime o objeto o usando seu método toString: 
print(String х): imprime a string 5; 
print(hase type bi: imprime o valor de b conforme seu tipo básico; 
printin(String +): imprime a string s, seguida pelo caractere de nova linha. 


Um exemplo de saida 
Considere, por exemplo, o seguinte trecho de código: 


System out.printf" Java values: =}, 
System.out.print[3 . 1415); 

System.out.print(* , "y; 

System.out.print(15); 

System.out.printi" (double, char, int}. "h 


Quando executado, este trecho de código produz a seguinte saída na janela console de Java: 


Java values: 3,1415,15 (double, char, int). 


Entrada simples usando a classe java.util. Scanner 


Assim como existe um objeto especial para enviar a saída para a janela de console de Java, existe 
também um objeto especial, chamado System.in, para executar a entrada de dados a partir da 
janela de console de Java. Tecnicamente, a entrada vem, na verdade, do "dispositivo de entrada- 
padrão”, o qual, por default, é o teclado do computador ecoando os caracteres na janela de conso- 
le de Java, O objeto System.in é um objeto associado com o dispositivo de entrada padrão. Uma 
maneira simples de ler a entrada usando este objeto é utilizá-lo para criar um objeto Scanner, 
através da expressão: 
new Scanner(System.in) 


A classe Scanner inclui uma série de métodos convenientes para ler do fluxo de entrada. Por 
exemplo, 1] programa que хер Le us ИП ohjeto Scanner [ага ртосекниг d entrada: 


import java.io.* ; 

import java.util. Scanner; 

public class InputExample [ 

public static vold main(Stringargs[ ]) throws IOException f 

Scanner 5 = new Scanner(System.in); 
Systam.out.print("Enteryourheightincentimeters: "|; 
float height = s.nextFloatí |; 
System.out.print("Enterycurweightinkilograms: "y 
float weight = s.nextFloatí ); 
float bmi = weight/(haeight*height)* 10000; 
aystem.out.println|"Youzbodymassindexis" + bmi + *,*k 


Quando executado, este programa gera o seguinte no console de Java: 


Enter your height in centimeters: 180 
Enter your weight in Kilograms: 80.5 
Your body mass index is 24.84568. 
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Métodos de java.util Scanner 


A classe Scanner lé o fluxo de entrada e divide o mesmo em tokens, que são strings de caracteres 
contiguos separados por delimitadores, que correspondem a caracteres separadores. O delimi- 
iador padrão é o espaço em branco, ou seja, tokens são separados por strings de espaços, tabu- 
lações ou nova-linha, por default, Tokens tanto podem ser lidos imediatamente como strings ou 
um objeto Scanner pode converter um token para um tipo base, se o token estiver sintaticamente 
correto, Para tanto, à classe Scanner inclut os seguintes métodos para lidar com tokens: 


hasMext()! retorna true se e somente se existe mais um token no strings de entrada. 


next): retorna o próximo taken do fluxo de entrada; gera um erro se não exis- 
tem mais tokens. 


hasMextTvpe(Tipey retorna true se e somente se existe mais um token no fluxo de entrada e 
se pode ser interpretado como sendo do tipo base correspondente, Tipo, 
onde Tipo pode ser Boolean, Byte, Double, Float, Int, Long ou Short. 

пехїГурей Про): retorna o próximo token do fluxo de entrada, retornando-o com o tipo 
hase correspondente a Tipo; gera uma erro se não existem mais tokens 
ou se o próximo token não pode ser interpretado como sendo do tipo 
base correspondente a Tipo. 


Além disso, objetos Scanner podem processar a entrada linha por linha, ignorando os deli- 
mitadores e mesmo podem procurar por padrões em linhas, Os métodos para processar a entrada 
desta forma incluem os seguintes: 


hasMextline(): retoma true se e somente se o fluxo de entrada tem outra linha de texto. 


nextLine(): avança a entrada até o final da linha corrente e retorna toda a entrada 
que foi deixada para trás. 
findinLineíString s): procura encontrar um string que combine com o padrão (expressão re- 
gular) s na linha corrente. Se o padrão for encontrado, ele é retomado 
e o scanner avança para o primeiro caractere depois do padrão. Se o 
padrão não for encontrado, o scanner retorna null e não avança. 


Esses métodos podem ser usados com os anteriores, como no exemplo que segue: 


Scanner input = new Scanner(System.in); 
System.out.print("^Please enter an integer: "|; 
while (linput.hasMextintí )) { 
input.nextLined l 
System.out.print("That's not an integer; please enter an integer: "|; 
} 
inti = input,nextira( ); 


1.7 Um programa de exemplo 


Nesta seção, será descrito um exemplo simples de programa Java que ilustra muitas das constru- 
ções definidas anteriormente, O exemplo consiste em duas classes: CreditCard, que define obje- 
tos que representam cartões de crédito; e Test, que testa as funcionalidades da classe CreditCard. 
Os objetos que representam cartões de crédito, definidos pela classe CreditCard, são versões sim- 
plificadas dos cartões de crédito tradicionais. Eles têm um número de identificação, informações 
de identificação do proprietário e do banco que os emitiram e informações sobre o saldo corrente 
e o limite de crédito. Não debitam juros ou pagamentos atrasados, mas restringem pagamentos 
que possam fazer com que o saldo vá além do limite de gastos. 
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A classe CreditCard 


A classe CreditCard é apresentada no Trecho de código 1.5. Ela define cinco variáveis de instán- 
cia, todas exclusivas, e possui um construtor simples que inicializa essas variáveis. 

Ela também define cinco métodos de acesso que permitem acessar o valor corrente dessas 
variáveis de instância, Evidentemente, as variáveis de instância poderiam ter sido definidas como 
públicas, o que faria com que os métodos de acesso fossem duvidosos, À desvantagem dessa 
abordagem direta, porém, é que permite ao usuário modificar as variáveis de instância do objeto 
diretamente, enquanto que, em muitos casos como este, é preferível restringir a alteração de 
variáveis de instância a métodos especiais chamados de métodos de atualização. No Trecho de 
código 1.5, inclui-se dois métodos de atualização, chargelt e makePayment. 

Além disso, é conveniente incluir métodos de ação. que com frequência definem as ações 
específicas do comportamento do objeto. Para demonstrar isso, define-se um método de ação, o 
printCard, como um método estático, que também está incluído no Trecho de código 1.5. 


A classe test 


A classe CreditCard é testada na classe Test. Observa-se aqui o uso de um arranjo de objetos 
CreditCard, wallet, e como se usam iterações para fazer débitos e pagamentos. Apresenta-se 0 có- 
digo completo da classe Test no Trecho de código 1.6. Para simplificar, a classe Test não produz 
nenhum gráfico elaborado, simplesmente envia a saída para о console de Java, Apresenta-se esta 
saida no Trecho de código 1.7. Observa-se a diferença na maneira em que se utilizam os métodos 
não-estáticos chargelt e makePaymant e o método estático printCard. 


public class CreditCard [ 

// Variáveis de instância: 
private String number, 
private String name; 
private String bank; 
private double balance; 
private int limit; 

“Construtor: 
CreditCard(String no, String nm, String bk, double bal, int lim) | 

number — no; 

name mim. 


bank = bk; 
balance = bal: 
limit = lim; 


| 
fr Métodos de acesso: 
public String getNumberi ) { return number; | 
public String getMame( | ( return name; | 
public String getBank( ) [ return bank; } 
public double getBalance( | ( return balance; | 
public int getLimit() { return limit; } 
## Metodos de ação: 
public boolean chargeltidouble price) { 4 Debita 
if (price + balance > (double) limit) 
return false; Não hà dinheiro suficiente para debitar 
balance += price; 
return true; // Neste caso o debito foi efetivado 
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public void makePaymentidouble payment) [ // Faz um pagamento 


balance -= payment; 


| 

public static void printCard(CreditCard с) { // Imprime informações sobre o cartão 
System.out.printin("Number = " + c.getNumber( )); 
System.out.printl"Name = " + c.getMame )): 


System.out.printin("Bank = " + c.getBank{ )); 


System.out.printin("Balance = " + c.getBalance( |; // conversão implicita 
System out.printin("Limit = " + c.getLimit( jy, // conversão implicita 


Trecho de código 1.5 A classe CreditCard. 


public class Test | 


public static void main(String[ ] args) | 
CreditCard wallet[ ] = new CreditCard[10]; 


wallet[0] = new CreditCard("5391 0375 9387 5109", 


"John Bowman", 


"California Savings", 0.0, 2500); 


waletf1] = new CreditCard(*3485 0399 3395 1954", 


"John Bosman”, 


"California Federal", 0.0, 3500) 


wallet[2] = new CreditCard("6011 4902 3294 2994", 


"John Bowman", 


for (int i-1; i —16; i +) ( 


wallet[Q].chargelt((double)): 
wallet[1].chargelt(2.0*iy; A conversão implicita 


"California Finance", 0.0, 5000); 


wallet[2].chargelt((doublej3*i); // conversão explicita 


| 
for (int i=0; i3; i+ +) { 


CreditCard.printCard(wallet[i]); 
while (wallet[].getBalance( ) > 100.0) { 
wallet[].makePayment(100.0); 


System.out.printinf" New balance = * + walet[]. getBalance( |): 


| 
| 
| 
| 


Trecho de código 1.6 


Number = 5391 0375 9387 5308 
Name = John Bowman 

Bank = California Savings 
Balance = 136.0 

Limit = 2500 

New balance = 36.0 

Number = 3485 0399 3385 1954 
Name = John Bowman 

Bank = California Federal 
Balance = 272.0 

Limit = 3500 

Mew balance = 172.0 

New balance = 72.0 


A classe Test. 
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Number = 6011 4902 3294 2994 
Name = John Bowman 

Bank = California Finance 
Balance = 408.0 

Limit = 5000 

Mew balance = 308.0 

New balance = 208.0 

New balance = 108.0 

Mew balance = 8.0 


Trecho de código 1.7 Saída da classe Test. 


1.8 Classes aninhadas e pacotes 


A linguagem Java usa uma abordagem prática e genérica para organizar as classes de um progra- 
ma. Toda a classe pública definida em Java deve ser fornecida em um arquivo separado O nome 
do arquivo é o nome da classe com uma terminação java. Desta forma, a classe public class 
SmartBoard, é definida em um arquivo chamado SmartBoard java. Nesta seção, são apresenta- 
das duas manciras interessantes pelas quais Java permite que várias classes sejam organizadas. 


Classes aninhadas 


Java permite que definições de classes sejam feitas dentro, isto é, aninhadas dentro das defini- 
ções de outras classes. Este é um tipo de construção útil que será explorada diversas vezes neste 
livro na implementação de estruturas de dados, O uso principal de classes aninhadas é para definir 
uma classe fortemente conectada com outra. Por exemplo, a classe de um editor de textos pode 
definir uma classe cursor relacionada, Definindo a classe cursor como classe aninhada dentro 
da definição da classe editor, mantém-se a definição destas duas classes altamente relacionadas 
juntas no mesmo arquivo. Além disso, permite que ambas acessem os métodos públicos uma da 
outra. Um aspecto técnico relacionado a classes aninhadas é que classes aninhadas podem ser de- 
claradas como static. Esta declaração implica que a classe aninhada está associada com a classe 
mais externa, mas não com uma instância da classe mais externa, isto é, um objeto especifico. 


Pacotes 


Um conjunto de classes relacionadas, todas pertencentes ao mesmo subdiretório, pode ser um 
package (pacote) Java. Cada arquivo em um pacote se inicia com a linha: 


package nome do pacote; 


O subdiretörio que contém o pacote deve ter o mesmo nome que o pacote. É possivel, tam- 
bém, definir um pacote em um único arquivo que contenha diversas definições de classe, mas 
quando for compilado, todas as classes o serão em arquivos separados no mesmo subdiretório, 

Em Java, pode-se usar classes que estão definidas em outros pacotes prefixando os nomes 
das classes com pontos (isto é usando o caractere 5") que corresponde à estrutura de diretório 
dos Oups pacmes. 


public boolean Temperature TA. Measures. Thermometer thermometer, 
int temperature) { 
Il... 
| 
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A função Temperature recebe a classe Thermometer como parâmetro. Thermometer é defini- 
da no pacote TA, em um subpacote chamado Measures. Os pontos em TA Measures. Thermometer 
têm correspondência direta com a estrutura de diretório do pacote TA. 

Toda a digitação necessária para fazer referência a uma classe fora do pacote corrente pode- 
se tomar cansativa. Em Java, é possível usar a palavra reservada import para incluir classes ex- 
lemas ou pacotes inteiros no arquivo corrente. Para importar uma classe individual de um pacote 
especifico, digita-se no inicio do arquivo o seguinte: 


import nome da pacote.nome da classe; 
Por exemplo, pode-se digitar 


package Project; 
import TA.Measures. Thermometer; 
import TA. Measures. Scale; 


no início do pacote Project para indicar que se está importando as classes TA Measures. Ther- 
mometer e TA.Measures.Scale. O ambiente de execução de Java irá procurar essas classes 
para verificar os identificadores com as classes, métodos e variáveis de instância que se usa no 
programa. 

Também se pode importar um pacote inteiro utilizando a seguinte sintaxe: 


import (packageName).*; 
Por exemplo: 


package student; 
import TA Measures. =; 


public boolean Temperature Thermometer thermometer, int temperature) | 
hls 
) 


Nos casos em que dois pacotes têm classes com o mesmo nome, deve-se referenciar especi- 
ficamente o pacote que contém a classe. Por exemplo, supondo que ambos os pacotes Gnomes e 
Cooking tenham uma classe chamada Mushroom (“cogumelo”), Se for determinado um comando 
import para cada pacote, deve-se especificar que classe se quer designar; 


Gnomes.Mushroom shroom = new Gnomes.Mushroom ("purple"); 
Cooking.Mushroom topping = new Cooking.Mushroom (|: 


Se não for especificado o pacote (ou seja, no exemplo anterior apenas foi empregada uma 
variável do tipo Mushroom), o compilador irá sinalizar um erro de "classe ambigua”. 

Resumindo a estrutura de um programa Java, pode-se ter variáveis de instância e métodos 
dentro de uma classe, além de classes dentro de um pacote. 


1.9 Escrevendo um programa em Java 


O processo de escrever um programa em Java envolve três etapas fundamentais: 


l. projeto, 
2. codificação, 
3. teste e depuração. 


Cada uma será resumida nesta seção. 
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1.9.1 


Projeto 


A etapa de projeto é talvez o passo mais importante no processo de escrever um programa. É na 
fase de projeto que se decide como dividir as tarefas do programa em classes, como essas clas- 
ses irão interagir com os dados que irão armazenar e que ações cada uma irá executar. Um dos 
matores desafios com o qual os programadores iniciantes se deparam em Java é determinar que 
classes definir para executar as tarefas do seu programa. Ainda que seja dificil obter prescrições 
genéricas, existem algumas regras práticas que podem ser aplicadas quando se está procurando 
definir as classes: 


+ Responsabilidades: dividir o trabalho entre diferentes atores, cada um com responsabi- 
lidades diferentes. Procurar descrever as responsabilidades usando verbos de ação. Os 
atores irão formar as classes do programa. 

• Independência: definir, se possível, o trabalho de cada classe de forma independente das 
outras classes. Subdividir as responsabilidades entre as classes de maneira que cada uma 
tenha autonomia sobre algum aspecto do programa. Fornecer os dados (como variáveis 
de instância) para as classes que тет competência sobre as ações que requerem acesso а 
esses dados. 

. Comportamento: as consequências de cada ação executada por uma classe terão de ser 
bem compreendidas pelas classes que interagem com ela. Portanto, é preciso definir о 
comportamento de cada uma com cuidado e precisão. Esses comportamentos irão definir 
os métodos que a classe executa O conjunto de comportamentos de uma classe é algumas 
vezes chamado de protocolo, porque espera-se que os comportamentos de uma classe 
sejam agrupados como uma unidade coesa. 


A definição das classes juntamente com seus métodos e variáveis de instância determina o 
projeto de um programa Java. Um bom programador. com o tempo, vai desenvolver naturalmente 
grande habilidade em executar essas tarefas à medida que a experiência lhe ensinar a observar 
padrões nos requisitos de um programa que se parecem com padrões já vistos. 


1.9.2 


Pseudocódigo 


Frequentemente, programadores são solicitados a descrever algoritmos de uma maneira que seja 
compreensível para olhos humanos, em vez de escrever um código real, Tais descrições são 
chamadas de psesdocódigo. Pseudo-código não é um programa de computador, mas é mais es- 
truturado que a prosa normal, Pseudo-código é uma mistura de língua-natural com estruturas de 
programação de alto-nivel que descrevem as idéias principais que estão por trás da implementa- 
ção de uma estrutura de dados ou algoritmo. Não existe, portanto, uma definição precisa de uma 
linguagem de psevdocódigo, em razão de sua dependência da lingua natural. Ao mesmo tempo, 
para auxiliar na clareza, o pseudo-código mistura língua natural com construções de padrão de 
linguagens de programação, As construções que foram escolhidas são consistentes com as mo- 
dernas linguagens de alto nível, tais como C, C++ e Java. 
Estas construções incluem: 


e Expressões: usam-se simbolos matemáticos padrão para expressões numéricas e boo- 
leanas. Usa-se a seta para esquerda (=) como operador de atribuição em comandos de 
atribuição (equivalente ao operador = de Java) e o sinal de igual (=) para o relacional de 
igualdade em expressões hoolcanas (equivalente ao relacional “= =" em Java). 

e Declarações de métodos: Algoritmo nome(paraml, param2, … ) declara um nome de 
método novo e seus parámetros, 


Conceitos Básicos de Programação Java 61 


• Estruturas de decisão: se condição, então ações caso verdade [senño, ações caso falso]. 
Usa-se identação para indicar quais ações devem ser incluidas nas ações caso verdade e 
nas ações caso falso, 

= Laços enquanto: enquanto condição, faça ações. Usa-se indentação para indicar quais 
ações devem ser incluídas no laço 

= Laços repete: repete ações até condição. Usa-se indentação para indicar que ações de- 
vem ser incluídas no laço. 

+ Laços for: for definição de variável de incremento, faça ações. Usa-se identacáo рага 
indicar que ações devem ser incluídas no laço. 

+ Indexação de arranjos: Ali] representa a i-ésima célula do arranjo A. As células de um ar- 
ranjo 4 com n células são indexadas de A[O] até Al — 1] (de forma consistente com Java). 

+ Chamadas de métodos: objeto.método(argumentos) (objeto é opcional se for suben- 
tendido). 

+ Retorno de métodos: retorn valor, Esta operação retorna o valor especificado para o mé- 
todo que chamou o método corrente, 

+ Comentários: | os comentários vào aqui |. Os comentários são colocados entre chaves. 


Quando se escreve pseudo-código, deve-se ter em mente que se está escrevendo para um lei- 
tor humano, não para um computador, Assim, o esforço deve ser no sentido de comunicar idéias 
de alto-nivel, e não detalhes de implementação. Ao mesmo tempo, não se deve omitir passos im- 
portantes. Como em muitas outras formas de comunicação humana, encontrar o balanceamento 
correto € uma habilidade importante, que é refinada pela prática. 


1.9.3 Codificação 


Como mencionado anteriormente, um dos passos-chave na codificação de um programa orientado 
a objetos é codificar a partir de descrições de classes e seus respectivos métodos. Para acelerar o 
desenvolvimento dessa habilidade, serão estudados, em diferentes momentos ao longo deste texto, 
vários padrões de projeto para os projetos de programas orientados a objeto (ver Seção 2.1.3). 
Esses padrões fornecem moldes para a definição de classes e interações entre essas classes. 

Muitos programadores não fazem seus projetos iniciais em um computador, e sim usando 
cartões CRC. Componente-responsabilidade-coloborador, ou CRC, são simples cartões indexa- 
dos que subdividem as tarefas especificadas para um programa, À idéia principal por trás desta 
ferramenta é que cada cartão represente um componente, o qual, no final, se transformará em 
uma classe de nosso programa. Escreve-se o nome do componente no alto do cartão, No lado 
esquerdo do mesmo, anotam-se as responsabilidades desse componente. No lado direito, listam- 
se os colaboradores desse componente, isto é, os outros componentes com os quals o primeiro 
terá de interagir de maneira a cumprir suas finalidades, O processo de projeto é iterativo através 
de um ciclo ação ator, onde primeiro se identifica uma ação (ou seja, uma responsabilidade) e. 
então, se determina e ator (ou seja, um componente) mais adequado para executar tal ação, O 
processo de projeto está completo quando se tiver associado atores para todas as ações. 

A propósito, ao utilizar cartões indexados para executar nosso projeto, assume-se que cada 
componente terá um pequeno conjunto de responsabilidades e colaboradores. Esta premissa não 
€ acidental, uma vez que auxilia a manter os programas gerenciáveis. 

Uma alternativa ao uso dos cartões CRC é o uso de diagramas UML (Linguagem de Mode- 
lagem Unificada”) para expressar a organização de um programa e pseudo-código para expressar 
algoritmos, Diagramas UML são uma notação visual padrão para expressar projetos orientados a 


* N.de T. Unified Modeling Language. 


62 


Estruturas de Dados e Algoritmos em Java 


objetos. Existem muitas ferramentas auxiliadas por computador capazes de construir diagramas 
UML. A descrição de algoritmos em pseudo-código, por outro lado, é uma técnica que será uti- 
lizada ao longo deste livro, 

Tendo decidido sobre as classes de nosso programa, juntamente com suas responsabilidades, 
pode-se começar a codificação. Cria-se o código propriamente dito das classes do programa 
usando tanto um editor de textos independente (por exemplo emacs, WordPad ou vi) como um 
editor embutido em um ambiente integrado de desenvolvimento (DES), tal como o Eclipse ou 
o Borland JBuilder. 

Após completar a codificação de uma classe (ou pacote), se compila o arquivo para código 
executável usando um compilador. Quando nào se está usando um IDE, então se compila o pro- 
grama chamando um programa tal como javac sobre o arquivo. Estando em uso um IDE, então 
se compila o programa clicando o botão apropriado. Felizmente se o programa não tiver erros de 
sintaxe, então o processo de compilação irá criar arquivos com a extensão "class". 

Se o programa contiver erros de sintaxe, estes serão identificados, e se terá de voltar ao editor de 
textos para consertar as linhas de código com problema. Eliminados todos os erros de sintaxe e cria- 
do o código compilado correspondente, pode-se executar o programa tanto chamando um comando, 
tal como “java” (fora de um IDE), ou clicando à botão de execução apropriado (dentro de um 
ШЕ). Quando um programa Java estiver executando dessa forma, o ambiente de execução localiza 
os diretórios contendo as classes criadas e quaisquer outras referenciadas a partir destas, usando uma 
variável especial de ambiente do sistema operacional. Essa variável é chamada de “CLASSPATH”, e 
a ordem dos diretórios a serem pesquisados é fomecida como uma lista de diretórios, separados por 
vírgulas se em Unix/Linux ou por ponto-e-vírgulas se em DOS Windows. Um exemplo de atribui- 
ção para a variável CLASSPATH no sistema operacional DOS/Windows pode ser o seguinte: 


SET CLASSPATHes.;C:Xiava;C: Program Files Java! 
Um exemplo de atribuição рага CLASSPATH no sistema operacional Uni Linux pode ser: 
setenv CLASSPATH ".:/usr/local/java/lib:/ugr/netscape/classes" 


Em ambos os casos, o ponto ("OI se refere ao diretório atual a partir do qual o ambiente de 
execução foi chamado, 


Javadoc 


Para incentivar o bom uso de comentários em bloco e a produção automática de documentação, o 
ambiente de programação Java vem com um programa para a geração de documentação chamado 
javadoc. Esse programa examina uma coleção de arquivos fontes Java que tenham sido comenta- 
dos usando-se certas palavras reservadas, chamadas de tags, e produz uma série de documentos 
HTML que descrevem as classes, métodos, variáveis e constantes contidas nestes arquivos, Por 
razões de espaço, não se usa o estilo de comentários do javadocs em todos os programas exem- 
plificadores contidos neste livro, mas se incluiu um exemplo de javadoc no Trecho de código 1.8, 
bem como em outros disponíveis no site da Web que acompanha este livro, 

Cada comentário javadoc é um comentário em bloco que se inicia com "/**", termina com 
“= e tem cada linha entre estas duas iniciada por um único asterisco, "*" que é ignorado, Pres- 
supõe-se que o bloco de comentário deve começar com uma frase descritiva seguida por uma 
linha em branco, e posteriormente por linhas especiais que começam por tags javadoc. Um co- 
mentário em bloco que venha imediatamente antes de uma definição de classe, uma declaração 
de variável ou uma definição de método é processado pelo javadoc em um comentário que se 
refere à classe, à variável ou ao método. 


* N. de To A abreviatura, já consagrada, corresponde à expressae em inglês integrated development environment, 
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p* de 
* Esta classe define um ponto (x,y) não alterável no plano 
E 
* &author Michael Goodrich 
+y 
public class *r Point { 
private double x,y. // variáveis de instância privada para as coordenadas 


gu 
* Constrói um ponto (x,y) em uma localização especifica 
de 
t &param xCoor A abscissa do ponto 
* (param yGoor À ordenada do ponto 


e 
public XYPoint(double xCoor, double yCaaor) | 
x = xCoor, 
y = yCoor; 
| 
pis 


= Retorna o valor da abscissa 


* 

* &return abscissa 

"r 
public double деб ) | return x; } 
ph * 


* Retorna o valor da ordenada 
ak 


+ &return ordenada 
+ 
public double getY() [ return x; } 
} 


Trecho de código 1.8 Um exemplo de definição de classe usando o estilo javadoc de comen- 
tärio, Observa-se que esta classe inclui apenas duas variáveis de instância, um construtor e dois 
métodos de acesso. 


As tags javadoc mais importantes são as seguintes: 


+ author fexto: identifica os autores (um por linha) de uma classe; 

* exception descrição do nome de uma exceção: identifica uma condição de erro sinali- 
zada por este método (ver Seção 2.3), 

+ param descrição de um nome de parámetro: identifica um parámetro aceito por este 
método; 

+ return descrição: descreve o tipo de retorno de um método e seu intervalo de valores. 


Existem outras tags como estas; o leitor interessado deve consultar a documentação online 
do javadoc para um estudo mais aprofundado, 
Clareza e estilo 


E possível fazer programas fáceis de ler e entender. Bons programadores devem, portanto, ser 
cuidadosos com seu estilo de programação, desenvolvendo-o de forma a comunicar os aspectos 
importantes do projeto de um programa tanto para os usuários como para os computadores, 
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Alguns dos princípios mais importantes sobre bons estilos de programação são os seguintes: 


e Usar names significativos para identificadores. Devem-se escolher nomes que pos- 
sam ser lidos em voz alta, que reflitam a ação, a responsabilidade ou os dados que o 
identificador está nomeando, Á tradição na maioria dos círculos de Java é usar maiús- 
culas na primeira letra de cada palavra que compõem um identificador, excetuando-se 
a primeira palavra de identificadores de variáveis ou métodos. Então, segundo esta 
tradição, “Date”, “Vector”, "DeviceManage" identificam classes e "isFull( )", “insertl- 
етк y”. "studentName" e "studentHeigth" referem-se, respectivamente, a métodos e 
a varidveis. 

+ Usar constantes ou tipos enumerados em vez de valores. A clareza, a robustez е a ma- 
nutenção serão melhoradas se forem incluídos uma série de valores constantes em uma 
definição de classe, Estes poderão então ser usados nesta e em outras classes para fazer 
referência a valores especiais desta classe. A tradição Java é usar apenas maiúsculas em 
tais constantes, como mostrado abaixo: 


public class Student ( 
public static final int MIN CREDITS = 12; // créditos minimos por periodo 
public static final int MAX CREDITS = 24; // créditos máximos por periodo 
public static final int FRESHMAM = 1; // código de calouro 
public static final int SOPHOMORE = 2; // código de aluno do primeiro ano 
public static final int JUNIOR = 3; // código para júnior 
public static final int SENIOR = 4; // código para sênior 


і! definições de variáveis de instância, construtores e métodos seguem aqui... 
} 


е Indentar os blocos de comandos. Os programadores normalmente indentam cada bloco de 
comandos com quatro espaços: neste livro, entretanto, usam normalmente dois espaços, 
para evitar que o código extravase as margens do livro. 

* Organizar as classes conforme a seguinte ordem: 


constantes, 
variáveis de Instância, 
constrütores, 

4. métodos. 


ja pa mm 


Alguns programadores Java preferem colocar as declarações de variáveis de instáncia 
por último, Aqui, opta-se por colocá-las antes, de forma que se possa ler cada classe 
sequencialmente, compreendendo os dados com que cada método está lidando. 

+ Usar comentários para acrescentar significado ao programa e explicar construções am- 
biguas ou confusas. Comentários de linha são úteis para explicações rápidas e não preci- 
sam ser frases completas. Comentários em bloco são úteis para explicar os propósitos de 
um método ou as seções de código complicadas. 


1.9.4 Teste e depuração 


Teste é o processo de verificar a correção de um programa; depuração é o processo de seguir a 
execução de um programa para descobrir seus erros. Teste e depuração são, em geral, as ativida- 
des que mais consomem tempo durante o desenvolvimento de um programa. 
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Teste 


Um plano de testes cuidadoso é parte essencial da escrita de um programa. Apesar de a verifica- 
ção da correção de um programa para todas as entradas possíveis ser normalmente impraticável, 
pode-se privilegiar a execução do programa a partir de subconjuntos representativos das entra- 
das. Na pior das hipóteses, deve-se ter certeza de que cada método do programa tenha sido testa- 
do pelo menos uma vez (cobertura de método), Melhor ainda, cada linha de código do programa 
deve ser executada pelo menos uma vez (cobertura de comandos). 

Em geral, as entradas dos programas falham em casos especiais, Tais casos precisam ser cui- 
dadosamente identificados e testados. Por exemplo, quando se testa um método que ordena (isto 
é, coloca em ordem) um arranjo de inteiros, deve-se considerar as seguintes entradas: 


se o arranjo tiver tamanho zero (nenhum elemento); 
se o arranjo tiver um elemento; 

se todos os elementos do arranjo forem iguais; 

se o arranjo já estiver ordenado; 

se o arranjo estiver ordenado na ordem inversa. 


Além das entradas especiais para o programa, deve-se também analisar condições especiais 
para as estruturas usadas pelo programa. Por exemplo, usando-se um arranjo para armazenar 
dados, é preciso ter certeza de que os casos-limite, tais como a inserção remoção no início ou mo 
tim do arranjo que armazena os dados, estão sendo convenientemente tratados. 

Se é essencial usar conjuntos de testes definidos manualmente, também é fundamental exe- 
cutar o programa a partir de grandes conjuntos de dados gerados randomicamente. A classe Ran- 
dom do pacote java.util oferece vários métodos para a geração de números randómicos. 

Existe uma hierarquia entre as classes é métodos de um programa, induzida pelas relações de 
“ativador-ativado”. [sto é, um método A está acima de um método B na hierarquia, se A chamar 
B. Existem duas estratégias de teste principais, top-down e bottom-up, que diferem na ordem em 
que os métodos são testados. 

O teste bottom-up é executado desde métodos de mais baixo nível até os de mais alto nível. 
Ou seja, métodos de mais baixo nível que não ativam outros métodos são testados primeiro, se- 
guidos pelos métodos que chamam apenas um método de baixo nível, e assim por diante, Esta 
estratégia garante que os erros encontrados em um método nunca são causados por um método 
de nível mais baixo aninhado no mesmo. 

O teste bottom-up é executado do topo para a base da hierarquia de métodos. Normalmente 
é usado em conjunto com terminadores, uma técnica de rotina de inicialização que substitui më- 
todos de mais baixo nivel por um tempdao?, um substituto para o método que simula a saida do 
método original. Por exemplo, se o método A chama o método B para pegar à primeira linha de 
um arquivo, quando se testa A pode-se substituir # por um tampão que retorna uma string fixa. 


Depuração 


A técnica mais simples de depuração consiste em usar comandos de impressão (usando o méto- 
do System.out.println(srring)) para rastrear os valores das variáveis durante a execução do pro- 
grama. Um problema desta abordagem é que os comandos de impressão, por vezes, necessitam 
ser removidos ou comentados antes de o programa poder ser executado, 

Lima melhor abordagem é executar o programa com um depurador, que é um ambiente 
especializado para controlar e monitorar a execução de um programa, A funcionalidade básica 


FN. de T. Em inglês, steh. 
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oferecida por um depurador é a inserção de pontos de parada* no código. Quando um programa 
é executado com um depurador, ele interrompe a cada ponto de parada. Enquanto o programa 
está parado, o valor corrente das variáveis pode ser verificado. Além de pontos de parada fixos, 
depuradores mais avançados permitem a especificação de pontos de parada condicionais, que 
são disparados apenas se uma determinada condição for satisfeita, 

As ferramentas-padráo de Java incluem um depurador básico chamado jdb, controlado por 
linhas de comando. Os IDEs para programação em Java oferecem ambientes de depuração avan- 
gados com interface gráfica com o usuário, 


1.10 Exercícios 


Para obter ajuda e o código fonte dos exercícios, visite java.datastructures.net. 


Reforço 
R-1.1 
R-1.2 
R-1.3 
R-1.4 
R-1.5 
R-1.6 
R-1.7 
R-1.8 
R-1.9 


* N. de Т. Em inglés, reeks. 


Suponha que seja criado um arranjo A de objetos GameEntry, que possui um 
campo inteiro scores, e que À seja clonado e o resultado seja armazenado em 
um arranjo В. Se o valor de A[4] score for imediatamente alterado para 550, 
qual o valor do campo score do objeto GameEntry referenciado por 8[4]7 
Modifique a classe CreditCard do Trecho de código 1.5 de maneira a debi- 
tar juros em cada pagamento. 

Modifique a classe CreditCard do Trecho de código 1.5 de maneira a de- 
bitar uma taxa por atraso para qualquer pagamento feito após a data de 
vencimento, 

Modifique a classe CreditCard do Trecho de código 1.5 para incluir méto- 
dos modificadores que permitam ao usuário modificar variáveis internas da 
classe CreditCard de forma controlada. 

Modifique a declaração do primeiro laço for da classe Test do Trecho de códi- 
go 1,6 de maneira que os débitos possam, mais cedo ou mais tarde, fazer com 
que um dos três cartões ultrapasse seu limite de crédito. Qual é esse cartão? 
Escreva uma pequena função em Java, inputAllBaseTypes que recebe dife- 
rentes valores de cada um dos tipos base na entrada padrão e o imprime de 
volta no dispositivo de saída padrão. 

Escreva uma classe Java, Flower, que tenha três variáveis de instância dos 
tipos String, int e float representando, respectivamente. o nome da flor, seu 
número de pétalas e o preço. À classe pode incluir um construtor que inicia- 
lize cada variável adequadamente, além de métodos para alterar o valor de 
cada tipo e recuperar o valor de cada tipo. 

Escreva uma pequena função em Java, isMultiple, que recebe dois valores 
long, n em, € retorna true $e e somente se né múltiplo de m, isto é, n = mi 
para algum inteiro F. 

Escreva uma pequena função Java isOdd. que recebe um int i e retoma true 
se e somente se é é par. Entretanto, esta função não pode usar operadores de 
multiplicação, módulo ou divisão. 


R-1.10 


R-1.11 


Criatividade 
C-1.1 


C-1.2 


C-1.3 


C-1.4 


C-1.5 


C-1.6 


Projetos 
P-1.1 


P-1.2 


P-1.3 
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Escreva uma pequena função em Java que receba um inteiro л e retorne à 
soma de todos os inteiros menores que n. 


Escreva uma pequena função em Java que receba um inteiro п e retorne à 
soma de todos os inteiros pares menores que т. 


Escreva uma pequena função Java que recebe um arranjo de valores int e 
determina se existe um par de números no arranjo cujo produto seja par. 
Escreva um método Java que recebe um arranjo de valores int e deter- 
mina se todos os números são diferentes entre si (isto é, se são valores 
distintos). 

Escreva um método em Java que receba um arranjo contendo o conjunto 
de todos os inteiros no intervalo de | a 52 e embaralhe os mesmos de 
forma aleatória, O método deve exibir as possíveis segliéncias com igual 
probabilidade. 

Escreva um pequeno programa em Java que exiba todas as strings possí- 
veis de serem formadas usando os caracteres 'c', а", "r^, 'b', 'o' e 'n’ ape- 
nas uma VEZ. 

Escreva um pequeno programa em Java que receba linhas de entrada pelo 
dispositivo de entrada padrão, e escreva as mesmas no dispositivo de saída 
padrão na ordem contrária. Isto & cada linha é exibida na ordem correta, 
mas a ordem das linhas é invertida. 

Escreva um pequeno programa em Java que receba dois arranjos a e Ё 
de tamanho n que armazenam valores int e retorne o produto escalar de 
a por ё. Isto €, retorna um arranjo с de tamanho n onde eli} = ali] - 610. 
para i = On l. 


Uma punição comum para alunos de escola é escrever à mesma frase várias 
vezes. Escreva um programa executável em Java que escreva a mesma frase 
uma centena de vezes: “Eu não mandarei mais spam para meus amigos”, 
Seu programa deve numerar as frases e “acidentalmente” fazer oito erros 
aleatórios diferentes de digitação. 

(Para aqueles que conhecem os métodos de interface gráfica com o usuário 
em Java.) Delina uma classe GraphicalTest que teste a funcionalidade da 
classe CreditCard do Trecho de código 1.5, usando campos de entrada de 
texto e bodes. 


O paradoxe do aniversário diz que a probabilidade de duas pessoas em 
uma sala terem a mesma data de amversário € maior que 50% desde que 
n, o número de pessoas na sala, seja maior que 23. Esta propriedade não € 
realmente um paradoxo, mas muitas pessoas se surpreendem. Projete um 
programa em Java que possa testar esse paradoxo por uma série de expe- 
cimentos sobre aniversários gerados aleatoriamente, testando o paradoxo 
рага п = 5,10, 15,20, … 100. 
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Observações sobre o capítulo 


Para mais informações sobre а linguagem de programação Java, indicamos ao lentor alguns 
dos melhores livros de Java: Arnold e Gosling [7], Campione e Walrath [19], Cornell e Horst- 
mana [26], Flanagan [34] e Horstmann [51], assim como a página de Java da Sun (http://www. 
java.sun.com ). 
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2.1 


2.1.1 


Objetivos, principios e padróes 


Como o próprio nome indica, os “atores” principais do paradigma de projetos orientados a 
objetos são chamados de objetos. Um objeto se origina de uma classe, que é uma especifica- 
ção tanto dos campos de dados, também chamados de varidveis de instância que um objeto 
contém, como dos métodos (operações) que pode executar. Cada classe apresenta para o mun- 
do exterior uma visão concisa е consistente dos objetos que são instâncias dessa classe, sem 
detalhes desnecessários ou acesso às estruturas internas dos objetos, Essa abordagem de com- 
putação visa a atingir diversos objetivos e a incorporar vários princípios de projeto que serão 
discutidos neste capítulo. 


Objetivos do projeto orientado a objetos 


Implementações de software devem buscar robustez, adaptabilidade e reusabilidade (ver Fi- 
gura 2.1). 


Robustez Adaptabilidade Reusabilidade 


Figura 2.1 Objetivos de um projeto orientado a objetos, 


Robustez 


Todo bom programador quer produzir software que seja correto, o que significa um programa 
que produz as saídas certas para todas as entradas previstas pela aplicação do programa. Além 
disso, é desejável que um software seja robusto, ou seja, capaz de lidar com entradas inesperadas 
que não estão explicitamente definidas em sua aplicação. Por exemplo, se um programa está 
esperando por um inteiro positivo (isto é, representando o preço de um item), mas recebe um 
inteiro negativo, deve ser capaz de se recuperar com elegância desse erro. No caso de aplicações 
de missão crítica, nas quais um erro de software pode causar ferimentos ou a perda da vida, a 
utilização de um software que não é robusto pode ser mortal, À importância disso foi enfatizada 
na década de 80, em acidentes envolvendo o Therac-25, uma máquina de terapia com radiação 
que aplicou superdoses em seis pacientes entre 1985 e 1987, alguns dos quais morreram de com- 
plicações resultantes das doses excessivas de radiação. Em todos os seis acidentes, detectou-se 
que a causa era proveniente de um erro de software. 


Adaptabilidade 


Os projetos modemos de software, tais como editores de texto, navegadores para Web e aplicati- 
vos de pesquisa na Internet, são normalmente programas grandes que devem durar muitos anos. 
O software, portanto, deve ser capaz de evoluir ao longo do tempo em resposta a alterações nas 
condições de seu ambiente. Sendo assim, a adaptabilidade (também chamada de capacidade 
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de evolução) é outro objetivo importante a ser atingido em qualidade de software. Outro con- 
ceito relacionado é portabilidade, que é a habilidade que um software tem de ser executado, 
com alterações mínimas, em diferentes plataformas de hardware ou sistemas operacionais. Uma 
das vantagens de se escrever programas em Java é a portabilidade oferecida naturalmente pela 
linguagem. 


Reusabilidade 


Da mesma forma que se busca a capacidade de adaptação, é desejável que um software possa ser 
reutilizável, ou seja, que seu código possa ser usado como componente de diferentes sistemas em 
várias aplicações. Desenvolver um software de qualidade pode ser um empreendimento caro, po- 
dendo seu custo ser diluído caso seja projetado de forma a ser reutilizável em aplicações futuras. 
Essa reutilização deve ser feita com cuidado, entretanto, uma vez que a maior fonte de erros do 
Therac-25 originou-se na reutilização inadequada do código do Therac-20 (que não foi projetado 
para a plataforma de software usada com o Therac-25), 


21.2 Princípios de projeto orientado a objetos 
Os principais princípios da abordagem orientada à objetos que visam a facilitar os objetivos an- 
teriormente descritos são os seguintes (ver Figura 2,2): 
* abstração, 


* encapsulamento, 
+ modularidade. 


Abstração Encapsulamento Modularidade 


Figura 2.2 Princípios de projeto orientado a objetos, 


Abstração 


A noção de abstração significa decompor um sistema complicado em suas partes fundamentais е 
descrevê-las em uma linguagem simples e precisa. À descrição das partes de um sistema implica 
atribuir-lhes um nome e descrever suas funcionalidades. Aplicar este paradigma ao projeto de es- 
truturas de dados nos leva a tipos abstratos de dados (TADs}. Um TAD é um modelo matemático 
de estruturas de dados que especifica o tipo dos dados armazenados, as operações definidas sobre 
esses dados e os tipos dos parámetros dessas operações. Um TAD define o que cada operação 
faz, mas não como o faz. Em Java, um TAD pode ser expresso por uma interface, que é uma sim- 
ples lista de declarações de métodos, onde cada método tem o corpo vazio. (Veremos mais sobre 
interfaces em Java na Seção 2.4.) 
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Um TAD é materializado por uma estrutura de dados concreta que, em Java, é modelada 
por uma classe, Uma classe define os dados que serão armazenados e as operações suportadas 
pelos objetos que são instância dessa classe. Além disso, ao contrário das interfaces, as classes 
especificam como as operações são executadas. Diz-se que uma classe em Java implementa 
uma interface quando seus métodos incluem todos os métodos declarados na interface, pro- 
vendo um corpo para os mesmos. Entretanto, uma classe pode ter mais métodos que aqueles 
definidos pela interface, 


Encapsulamento 


Outro princípio importante em projeto orientado a objetos é o conceito de encapsulamento, que 
estabelece que os diferentes componentes de um sistema de software não devem revelar detalhes 
de suas respectivas implementações, Uma das maiores vantagens do encapsulamento é que ele 
oferece ao programador liberdade na implementação dos detalhes do sistema. À Única restrição 
ao programador € manter a interface abstrata que é percebida pelos de fora. 


Modularidade 


Além de abstração e do encapsulamento, outro princípio fundamental de projeto orientado a ob- 
jetos é a modularidade. Sistemas modernos de software normalmente são compostos por vários 
componentes diferentes que devem interagir corretamente, fazendo com que o sistema como 
um todo funcione de forma adequada. Para manter essas interações corretas, é necessário que 
os diversos componentes estejam bem organizados, Na abordagem orientada a objetos, essa or- 
ganização se centra no conceito de modularidade. A modularidade se refere a uma estrutura 
de organização na qual os diferentes componentes de um sistema de software são divididos em 
unidades funcionais separadas. 


Organização hierárquica 


A estrutura imposta pela modularıdade auxilia a tornar o software reutilizável. Se os módulos 
do software forem escritos de uma forma abstrata para resolver problemas genéricos, então os 
módulos podem ser reutilizados quando instâncias do mesmo problema geral surgirem em outros 


contextos, 
| 


Prédia 


comercial 


Apartamento | | В 
Apariamento de E Térreo e zu A 
i de mais de 2 - Arranha-céón 
até 2 andares в E ur = u ! 
até 2 andares laren andar superior || 


Figura 2.3 Exemplo de uma hierarquia “é um" compreendendo prédios arquitetônicos. 
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Por exemplo, a estrutura de definição de uma parede é a mesma de casa para casa, sendo 
normalmente definida em termos de barrotes de duas por quatro polegadas, espaçados por uma 
distância específica, etc. O arquiteto organizado pode, assim, reutilizar suas definições de parede 
de uma casa para outra, Ao reutilizar tais definições, algumas partes podem exigir adaptações, 
por exemplo, uma parede em um edifício comercial pode ser similar à de uma casa, mas o siste- 
ma elétrico pode ser diferente. 

Uma forma natural de organizar vários componentes estruturais de um pacote de software 
é de uma forma hierárquica, que agrupa definições abstratas similares juntas nível a nível, par- 
nde do mais específico para o mais genérico, à medida que se percorre a hierarquia. Um uso 
normal de tais hierarquias ocorre em um gráfico organizacional, no qual cada arco que sobe pode 
ser lido como “é um”, como em “um rancho é uma casa é um prédio”. Esse tipo de hierarquia 
também é útil no projeto de software quando agrupa funcionalidades comuns no nível mais geral 
e ve comportamentos especializados como uma extensão do comportamento geral. 


2.1.3 Padrões de projeto 


Uma das maiores vantagens do paradigma de projeto orientado a objetos é que ele facilita o 
desenvolvimento de software reusável, robusto e adaptável, Projetar código orientado a objetos 
de qualidade exige mais do que simplesmente entender as metodologias de projeto orientado a 
objetos. Requer o uso efetivo das técnicas de projeto orientado a objetos, 

Cientistas da computação e profissionais da área desenvolveram uma variedade de conceitos 
organizacionais e metodologias para projetar softwares orientados a objetos de qualidade que sejam 
concisos, corretos e reutilizáveis. Um conceito especialmente relevante no contexto deste livro é o 
conceito de padrão de projeto, que descreve uma solução para um determinado problema de projeto 
de software "tipico". Um padrão provê um esquema genérico de uma solução que pode ser aplicada 
em muitas situações diferentes. Descreve os elementos principais da solução de uma forma abstrata 
que pode ser especializada para o problema especifico que se apresenta. Consiste em um nome que 
identifica o padrão, um contexto que descreve os cenários para os quais se aplica, um esquema que 
descreve como é aplicado e um resultado que descreve e analisa o que o padrão produz. 

Diversos padrões de projeto serão mostrados neste livro, e será indicado como podem ser 
aplicados com consistência no projeto de implementações de qualidade de estruturas de dados e 
algoritmos, Esses padrões se organizam naturalmente em dois grupos: padrões para resolver pro- 
blemas de projeto de algoritmos e padrões para resolver problemas de engenharia de software. 
Alguns dos padrões para projeto de algoritmos que serão apresentados incluem: 


* recurso (Seção 3.5); 

e amortização (Seção 6.1.4), 

* divisão e conquista (Seção 11.1.1); 

& poda e busca também conhecido como diminuição e conquista (Seção 11.7.1); 
* força bruta (Seção 12.2.17; 

* 0 método guloso (Seção 12.4.7); 

+ programação dinâmica (Seção 12,5.2) 


Da mesma forma, alguns dos padrões para engenhana de software apresentados são: 


* posicionamento (Seção 6.2.2): 
è adaptador (Seção 6.1.2) 

* iteradores (Seção 6.3); 

* método do esquema (Seção 7.3.7, 11.б е 13.3.2): 
* composição (Seção 8.1.2); 

comparador (Seção 8.1.2): 

decorador (Seção 13.3.1). 


74 


Estruturas de Dados e Algoritmos em Java 


Em vez de explicar, inicialmente, cada um desses conceitos, os mesmos serão introduzidos 
ao longo do texto, como se verá na sequência. Para cada padrão, seja para engenhana de algorit- 
mo, seja para engenharia de software, será explicado seu uso genérico e ilustrado pelo menos um 
exemplo concreto. 


2.2 Herança e polimorfismo 


Para tirar proveito de relacionamentos hierárquicos comuns em projetos de software, a aborda- 
gem de projeto orientado 4 objetos oferece maneiras de reutilizar código. 


гол 


Herança 


О paradigma de orientação a objetos oferece uma estrutura hierárquica e modular para reutilização 
de código através de uma técnica conhecida como herança, Essa técnica permite projetar classes 
genéricas que podem ser especializadas em classes mais particulares, em que as classes especia- 
lizadas reutilizam o código das mais genéricas. À classe genérica, também conhecida por classe 
base ou superclasse, define variáveis de instância “genéricas” e métodos que se aplicam em uma 
variada gama de situações. A classe que especializa, estende ou herda de uma superclasse nào ne- 
cessita fornecer uma nova implementação para os métodos genéricos, uma vez que os herda. Deve 
apenas definir aqueles métodos que são especializados para esta subclasse em particular. 


Exemplo 2.1 Considere a classe S que define objetos com o campo x, e três métodos al), b() e 
cl). Supõe-se que a classe T que estende 5 seja definida incluindo um campo adicional, y, e dois 
métodos, d() e al}. A classe T herdará a variave! de instancia e os métodos al) b() e oi} de S. Os 
relacionamentos entre as classes 5 e T ado apresentados no diagrama de classes com herança 
da Figura 2.4, Cada caixa nesse diagrama indica uma classe, com seu nome, campos (ou varid- 
veis de instancia je métodos incluídos como retángulos aninhados. 


classe: T 
campos: y 


métodos: di) 


eli 


Figura 2.4 Um diagrama de classe com herança. Cada caixa indica uma classe, com seu nome, 
campos e métodos, e uma seta entre as caixas denota um relacionamento de herança. 
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Criacáo de objetos e referéncias 


Quando um objeto e é criado, aloca-se memória para seus campos, e esses mesmos campos são 
inicializados para valores iniciais específicos. Normalmente, associa-se o novo objeto e com uma 
variável que serve de “ligação” com o objeto o, e diz-se que é a mesma referência o. Quando se 
deseja acessar o objeto o (para acessar seus campos ou ativar seus métodos), pode-se tanto solici- 
tar a execução de um dos métodos de o (definidos na classe à qual o pertence) ou procurar um dos 
campos de o. Na verdade, a principal maneira pela qual um objeto p interage com outro objeto 
o é o envio de uma mensagem de p para o que invoque um dos métodos de e, por exemplo, para 
fazer o imprimir uma descrição de si mesmo, para que o converta a si mesmo em uma string ou 
para que retome o valor de um de seus campos de dados. Uma forma secundária pela qual p pode 
interargir com o é através do acesso direto de p a um dos campos de o, mas 1550 sÓ é possível se 
o tiver dado permissão para objetos do tipo de p fazê-lo, Por exemplo, uma instância da classe In- 
teger de Java armazena um inteiro em uma variável de instância e fornece várias operações para 
acessar esse dado, incluindo métodos para converté-lo em outros tipos numéricos ou em uma 
string de dígitos e também para converter uma string de dígitos em um número, Ela não permite, 
entretanto, o acesso direto à variável de instância, uma vez que tais detalhes estão escondidos. 


Ativação dinâmica 

Quando um programa deseja ativar um método af) de algum objeto o, ele envia uma mensagem 
рага o, б que normalmente é feito usando-se à sintaxe do operador ponto (Seção 1.3.2) da seguinte 
forma: “oaf Y”. Na versão compilada desse programa, o código correspondente a essa ativação 
ordena ao ambiente de execução que examine a classe T de о para verificar se a classe T suporta o 
método aí |, e, em caso positivo, executa o mesmo, Mais especificamente, o ambiente de execução 
examina a classe T para verificar se ela define o método al}. Se assim ocorre, então esse método 
é executado. Se T nào define o método al j, então o ambiente de execução examina S, a super- 
classe de T. Se 5 define aí), então esse método é executado. Por outro lado, se 5 não define af ), 
então o ambiente de execução repete a busca na superclasse de S. Essa busca continua subindo a 
hierarquia de classes até que se encontre o método al), que é então executado, ou que se encontre 
а classe de nivel mais alto (por exemplo, a classe Object em Java) sem o método al), o que gera 
um erro de execução. O algoritmo que processa a mensagem cal) para encontrar o método a ser 
disparado é chamado de algoritmo de ativação dinámica (ou de ligação dinámica), o qual oferece 
um mecanismo efetivo para localizar software reutilizado, Ele também permite o uso de outra 
técnica poderosa de programação orientada a objetos: o polimorfismo. 


2.2.2 Polimorfismo 


Literalmente, “polimorfismo” significa “muitas formas". No contexto de projeto orientado a ob- 
tetos, entretanto, refere-se à habilidade de uma variável de objeto de assumir formas diferentes, 
Linguagens orientadas a objetos, tais como Java, referenciam objetos usando variáveis referência, 
Uma variável referência o deve especificar que tipo de objeto é capaz de referenciar em termos de 
uma classe S. Isso implica, entretanto, que o também pode se referir a qualquer objeto pertencente 
à classe T derivada de S. Agora, será analisado o que acontece se S define um método aí) e T tam- 
bém define um método al). O algoritmo de ativação dinámica de métodos sempre inicia sua busca 
pela classe mais restritiva à qual se aplica Quando o se refere a um objeto da classe T e o.a() é invo- 
cado, então é ativada a versão de T do método al ), em lugar da versão de S. Neste caso, diz-se que 
T sobrescreve o método al } de S. Por outro lado, se o se refere a um objeto da classe S (que, ao 
contrário, não é um objeto da classe T), quando o.a( ) for ativado, será executada a versão de S de 
al). Um polimorfismo como esse é ütil porque aquele que chama cal) nào precisa saber quando 
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о se refere a uma instância de T ou S para poder executar a versão correta de a(). Dessa forma, a 
variável de objeto o pode ser polimórfica, ou assumir muitas formas, dependendo da classe es- 
pecifica dos objetos aos quais está se referindo, Esse tipo de funcionalidade permite a uma classe 
especializada T estender uma classe S, herdar os métodos padrão de S e redefinir outros métodos 
de 5, de maneira que sejam incluídos como propriedades específicas dos objetos T 

Algumas linguagens orientadas а objetos, como Java, também oferecem uma técnica relä- 
cionada a polimorfismo que é chamada de sobrecarga de métodos. A sobrecarga ocorre quando 
uma única classe T tem vários métodos com o mesmo nome, desde que cada um tenha uma 
assinatura diferente. À assinatura de um método é uma combinação entre seu nome, o tipo e à 
quantidade de argumentos que são passados para o mesmo. Dessa forma, mesmo que vários më- 
todos de uma classe tenham o mesmo nome, eles são distinguíveis pelo compilador pelo fato de 
lerem diferentes assinaturas, ou seja, na verdade são desiguais. Em linguagens que possibilitam 
а sobrecarga de métodos, o ambiente de execução determina qual método ativar para uma deter- 
minada chamada de método que percorre a hierarquia de classes em busca do primeiro método 
euja assinatura combine com à do método que está sendo invocado, Por exemplo, imagine uma 
classe T que define o método af), derivada da classe U que define o método а(х, у). Se um objeto 
o da classe T recebe a mensagem "o.a(x, y), então a versão de U do método a é ativada (com os 
dois parámetros, x e y). Assim, o verdadeiro polimorfismo aplica-se apenas а métodos que têm a 
mesma assinatura mas estão definidos em classes diferentes, 

A herança, o polimorfismo e a sobrecarga de métodos suportam o desenvolvimento de soft- 
ware reutilizável. Podem-se estabelecer classes que herdam as variáveis € os métodos de imstán- 
cla genéricos e que, a seguir, definem novas variáveis e métodos de instância mais específicos 
que lidam com os aspectos particulares dos objetos da nova classe. 


2.2.3 


Usando heranga em Java 


Existem duas formas básicas de se usar herança de classes em Java: extensão e especialização. 


Especialização 


Quando se usa a especialização, estamos refinando uma classe genérica em subclasses especí- 
ficas. Tais subclasses normalmente possuem uma relação do tipo “é um" com sua superclasse. 
Estas subclasses herdam todos os métodos da superciasse, Para cada método herdado, caso 
funcione corretamente independente do fato de estar sendo usado pela especialização, nenhum 
esforço adicional é necessário. Se, por outro lado, um método genérico da superclasse não 
funcionar corretamente na subclasse, então é necessário sobrecarregar o método para obter a 
funcionalidade correta da subclasse. Por exemplo, pode-se ter uma classe genérica Dog ("ca- 
chorro") que possui o método drink (“beber”) e o método sniff (“farejar”), Ao especializar à 
classe Bloodhound (“cão de caga”), provavelmente nào será necessário especializar o método 
drink, na medida em que todos os cachorros bebem da mesma forma. Contudo, provavelmente 
será necessário sobrecarregar o método sniff, na medida em que um cão de caça tem um faro 
muito mais sensível que um cão “genérico”. Dessa forma, a classe Bloodhound especializa os 
métodos da superclasse Dog. 


Extensão 


Ano usar a extensão, por outro lado, utiliza-se herança para reutilizar o código escrito para os 
métodos da superelasse, mas será necessário adicionar novos métodos que não estão presentes 
na superclasse, de maneira a estender sua funcionalidade. Por exemplo, reconsiderando a classe 
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Dog. pode-se querer criar à subclasse BorderGollie (“cão pastor”) que herda todos os métodos 
genéricos da classe Dog mas adiciona um método novo, herd (“arrebanbar”), uma vez que ches 
pastores têm um instinto para o pastoreio que não está presente nos ches genéricos. Adicionando 
o novo método, está-se estendendo a funcionalidade do cão genérico, 

Em Java, cada classe pode estender apenas uma única classe. Mesmo que uma classe não 
faça uso explícito da cláusula extends, ainda assim é derivada de exatamente uma classe, neste 
caso a classe јама lang. Object. Em virtude desta propriedade, diz-se que Java possibilita apenas 
herança simples entre classes. 


Tipos de sobrecarga de método 


Dentro da declaração de uma classe nova, Java usa dois tipos de sobrecarga de método, o refina- 
mento e a substituição. Na sobrecarga por substituição, o novo método substitui completamente 
o método da superclasse que está sendo sobrecarregado (como no caso do método sniff da classe 
Bloodhound mencionada anteriormente). Em Java, todos os métodos normais de uma classe titi- 
lizam este tipo de comportamento na sobrecarga. 

Na sobrecarga por refinamento, entretanto, um método não substitui o método de sua su- 
perclasse, mas do contrário, adiciona código ao de sua superclasse. Em Java, todos os constru- 
tores utilizam sobrecarga por refinamento, um esquema chamado de encadeamento de cons- 
trutores, Isto é, um construtor inicia sua execução chamando o construtor de sua superclasse, 
Essa chamada pode ser feita de forma explícita ou implícita. Para chamar o construtor de uma 
superclasse, explicitamente, usa-se a palavra reservada super, para fazer referência à super- 
classe. (Por exemplo, superi ) chama o construtor da superclasse que não tem parámetros. 
Se nenhuma chamada explícita € feita no corpo do construtor, entretanto, o compilador insere 
automaticamente, па primeira linha do construtor, uma chamada рага o método super] ). (Exis- 
te uma exceção a esta regra geral que será discutida na próxima seção. + Em resumo, em Java 
os construtores usam sobrecarga por refinamento, enquanto que os métodos normais usam à 
substituição, 


A palavra reservada this 


Algumas vezes, em uma classe Java, É conveniente referenciar a instância corrente da classe. 
Java oferece uma palavra reservada, chamada this, para tal referência. A referência this é útil, 
por exemplo, quando se deseja passar o objeto corrente como parámetro de algum método. 
Outra aplicação é referenciar um campo do objeto corrente cujo nome está em conflito cam o 
nome de uma variável definida no bloco corrente, como no programa apresentado no Trecho de 
código 2.1 


public class ThisTester [ 
public int dog = 2;  //variável de instância 
public void clobberi ) { 
int dog = 5; /! um cachorro diferente! 
System out.println(" The dog local variable = " + dog); 
aystem.out.println" The dog field = " + thisdogk 
} 
public static void main(String args[ |) { 
ThisTester t = new This Testeri |; 
t.clobberf); 
| 
} 


Trecho de código 21 Programa exemplo que ilustra o uso da referência this para resolver a 
ambigüidade entre um campo do objeto corrente e a variável local com mesmo nome. 
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Quando este programa é executado, imprime o seguinte: 


The dog local variable = 5.0 
The dog field = z 


Um exemplo de herança em Java 


Para tornar as noções de herança e polimorfrsmo mais concretas, serão analisados alguns exem- 
plos samples em Java, 

^urticularmente, serão utilizados alguns exemplos de classes que percorrem e imprimen 
progressões numéricas. Uma progressão numérica é uma sequência de números em que o valor 
de cada um depende de um ou mais valores anteriores. Por exemplo, uma progressão aritmética 
determina o próximo número por meto de adições, e uma progressão geométrica, por multipli- 
cagües, Em qualquer caso, uma progressão exige uma forma determinativa do valor inicial, bem 
como uma maneira de identificar o valor corrente. 

Inicia-se definindo a classe, Progression, apresentada no Trecho de código 2.2, que estabe- 
lece os campos e métodos “genéricos” de uma progressão numérica. Em particular, dois campos 
inteiros longos são definidos: 


e first: o primeiro valor da progressão; 
* cur: o valor atual da progressão: 


hem como os trés métodos a seguir: 
firstValue( у: Retorna a progressão ao primeiro valor e retorna esse valor, 
nextValue( y: Avança a progressão para o próximo valor e retoma esse valor. 


printProgression(n: Retorna a progressão para o inicio e imprime os primeiros м valores da 
progressão. 


Diz-se que o método printProgression não tem saída no sentido de que não retoma nenhum 
valor, enquanto que os métodos firstvalue e next\/alue retornam ambos inteiros longos. Ou seja, 
firstValue e nextValue são funções, enquanto printProgression é um procedimento, 

А classe Progression também inclui o método Progressionf }, que é um método construtor. 
Lembre-se que os métodos construtores inicializam às variáveis de instância no momento da 
criação do objeto. A classe Progression visa a ser uma superclasse genérica, a partir da qual 
classes especializadas são derivadas, de maneira que o código do construtor será incluído nos 
construtores de cada uma que estende a classe Progression. 
pe 

* Uma classe de progressão numérica. 
"y 
public class Progression { 
/** Primeiro valor da progressão. */ 
protected long first; 


/** Valor atual da progressão. */ 
protected long cur; 


/** Construtor default. +/ 
Progression) | 

cur = first = 0; 
} 


/** Reinicializa a progressão com o valor inicial, 
* 


* Sreturn valor inicial 
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E 

protected long firstvaluel ) { 
cur = first; 
return cur; 


} 
4% Avança a progressão para o próximo valor. 
+ 


+ return próximo valor da progressão 
+y 
protected long nextValuei ) [ 
return + +cur; próximo valor default 
} 
/** Imprime os primeiros valores n da progressão 
sh 
* Sparam número n de valores a serem impressos 
+ 
public void printProgression(int n) I 
System.out.printifirstValue( JJ; 
for (inti 2 2:1 <= n; i++) 
System. out printi" * + nextValued Jy. 
System out. printing); 4 termina a linha 
| 
| 


Trecho de código 2.2 Classe genérica de progressão numérica. 


Uma classe de progressáo aritmética 


Será analisada, na segiiéncia, a classe ArithProgression, apresentada no Trecho de código 2.3. 
Essa classe define uma progressão em que cada valor é determinado pela adição de um incre- 
mento fixo, inc, ao valor anterior. Ou seja, ArithProgression define uma progressão aritmética. 
ArithProgression herda os campos first e cur, bem como os métodos firstValue( ) e printProgres- 
siord | da classe Progression. Adiciona um novo campo, inc, para armazenar o incremento, e dois 
construtores para inicializá-do, Finalmente, sobrescreve o método nextValue( ) para adequá-lo à 
forma pela qual será obtido o próximo termo de uma progressão antmêtica. 

O polimorfismo está presente neste caso. Quando uma referência para Progression aponta 
para um objeto da classe ArithProgression, então os métodos firstValue() e nextValue() de ArithPro- 
gression serão usados. Este polimorfismo também é real na versão herdada de printProgression(n), 
pois as chamadas dos métodos firstValue( | e nextValue( ) são implícitas para o objeto corrente 
(chamado de this em Java). que neste caso corresponderá à classe ArithProgression. 


Exemplo de construtores e da palavra reservada this 


Na definição da classe ArithProgression, foram adicionados dois métodos construtores: um mé- 
todo default, sem parámetros, e uma versão parametrizada que recebe um inteiro para ser usado 
como incremento da progressão. O construtor default, na verdade, chama o método parametri- 
zado usando a palavra reservada this e passando | como valor do parâmetro a ser usado como 
incremento. Esses dois construtores ilustram à sobrecarga de métodos na qual um nome de mé- 
todo pode ter várias versões dentro de uma mesma classe, uma vez que, na verdade, um método 
é especificado pelo seu nome, pela classe do objeto que o ativa e pelos tipos dos parâmetros que 
são passados para o mesmo — sua assinatura. Neste caso, a sobrecarga é dos métodos construtores 
(um construtor default e um construtor parametrizado). 


su 
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А chamada this(1) ao construtor parametrizado, como primeiro comando do construtor de- 
fault, configura uma exceção à regra geral de ativação em cascata de construtores, discutida na 
Seção 2,2.3. Na verdade. quando o primeiro comando de um construtor С° chama outro cons- 
trutor C^ da mesma classe usando a referência this, o construtor da superclasse não é automati- 
camente acionado por С“, Observa-se que o construtor da superclasse pode ser, eventualmente. 
acionado ao longo da cadera, tanto de Forma implícita como explicita. No caso particular da clas- 
se ArithProgression, o construtor default da superclasse (Progression) é ativado implicitamente 
como primeiro comando do construtor paramétrico de ArithProgression. 

Construtores serão discutidos em mais detalhes na Seção 1.2, 

e 

* Progressão aritmética. 

+y 

class ArithProgression extends Progression 


/*? Incremento. */ 
protected long inc; 


// Herda as variáveis first e cur. 


/** Construtor default inicializa com incremento de 1. */ 
ArithProgressiani ) { 

this(1): 
| 
¿2 Construtor paramétrico fornece o incremento. */ 
ArithProgression(long increment) | 

inc = increment; 


) 


/** Avança a progressão acrescentando o incremento ao valor atual. 


* (return próximo valor da progressão 
E 
protected long nextvaluel | | 

cur += ING; 

return cur; 


/! Herda оз métodos firstValue() e printProgression(int). 
|| 


Trecho de código 2.3 Classe de progressão aritmética que herda da progressão genérica apre- 
sentada no Trecho de código 2.2. 


Uma classe de progressão geométrica 


será definida em seguida a classe GeomProgression, apresentada no Trecho de código 2.4, que 
permite tanto navegar através de uma progressão geométrica como imprimi-la, sendo esta deter- 
minada pela multiplicação do valor prévio por uma base b. Uma progressão geométrica é como 
uma progressão genérica, exceto pela forma como se determina o próximo valor. Desta for- 
ma, GeomProgression é declarada como subclasse da classe Progression. Da mesma forma que 
ArithProgression, a classe GeomProgression herda os campos first e cur, bem como os métodos 
firstValue e printProgression da classe Progression. 


a 


* Progressão geométrica 
+ 


class GeomProgression extends Progression [ 


/** Base */ 
protected long base; 


// Herda as variáveis first в cur. 


“* Construtor default inicializa o valor base com а, */ 
GeomProaression( ) ( 

this(2); 
} 


r** Construtor paramétrico fomece o valor base. 
* &param base é o valor base da progressão. 
E 

GeomProgression(long b) [ 

base - b; 
first = 1; 
cur = first; 


} 
/** Avança a progressão multiplicando a base pelo valor corrente. 
* 


* &return próximo valor da progressão 
Li 
protected long nextWaluel | { 

cur *= base; 

returm cur; 


} 
U Herda os métodos firstValue() e printProgression(nt). 


Trecho de código 2.4 Classe de progressão geometrica. 


Uma classe de progressão Fibonacci 


Como último exemplo, será definida a classe FibonacciProgression, que representa um outro tipo 
de progressão, a progressão Fibonacci, na qual o próximo valor é definido pela soma dos valores 
atuais com os anteriores, À classe FibonacciProgression será apresentada no Trecho de código 
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2,5, Observe-se o uso do construtor parametnrizado na classe FibonacciProgression, oferecendo 


uma forma diferente de iniciar a progressão. 


mn 


* Progressão Fibonacci 
"/ 


class FibonacciProgression extends Progression { 


++ Valor anterior. */ 
long prev; 
H Herda as vanáveis first е cur 
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/** Construtor default inicializa os dois primeiros valores como sendo О e 1. */ 
FibonacciProgression( ) { 
this(0, 1); 


/** Construtor paramétrico fornece o primeiro e o segundo valores. 
E: 


* Gparam value1 é o primeiro valor. 
* &param value? ё o segundo valor. 
e 
FibonacciProgression(long value, long value?) [ 
first = value; 
prev = value? — value; // valor fictício que antecede o primeiro 
} 


/** Avança a progressão somando o valor anterior no valor atual. 
* 


* Gratum próximo valor da progressão 
ER 
protected long nextValue | { 

long temp = prev; 

prev = cur, 

cur += temp; 

return cur; 


| 
// Herda os métodos firstValue( ) e printProgression(nt). 


Trecho de código 2.5 Classe para a progressão Fibonacci. 


Para visualizar a maneira pela qual as três diferentes progressões são derivadas da classe 
genérica Progression, apresenta-se o diagrama de herança correspondente na Figura 2,5. 

Para completar o exemplo, define-se a classe Tester, indicada no Trecho de código 2.6, que 
executa um teste simples com cada uma das trés classes, Nesta classe, a variável prog é polimör- 


métodos; 
Progression) 
long firstvadue[ 
lang nextWaluef 
void pritProgressioe int) 


ArithProgressiont | 
ArtthProgression(lonig) 
long пехіуай | lang nestle } 


Figura 2.5 Diagrama de herança da classe Progression e suas subclasses. 
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fica durante a execução do método main, uma vez que referencia, alternadamente, objetos das 
classes ArithProgression, GeomProgression e FibonacciProgression. Quando o método main da 
classe Tester € ativado pelo sistema de execução de Java, a saída resultante é a apresentado no 
Trecho de código 2.7. 

( exemplo desta seção é propositadamente pequeno, mas faz uma demonstração simples 
do uso de herança em Java. A classe Progression, suas subclasses e o programa de teste, en- 
tretanto, tém uma série de defeitos que não são percebidos à primeira vista. Um dos proble- 
mas é que às progressões geométrica e Fibonacci crescem rapidamente, e não existe previsão 
de tratamento para o estouro inevitável dos inteiros longos envolvidos. Por exemplo, uma 
vez que 3"> 2" uma progressão geométrica de base b = 3 irá estourar a capacidade de um 
inteiro longo após 40 iterações. Da mesma forma, o 94" número da série de Fibonacci é maior 
que aM logo, a progressão Fibonacci irá explodir a capacidade de um inteiro longo após 94 
iterações. Outro problema é que nào se admitem valores iniciais arbitrários para uma pro- 
gressão Fibonacci, Por exemplo, pode-se considerar uma progressão de Fibonacci iniciada 
em 0 e -17 Lidar com os erros de entrada ou com as condições de erro que ocorrem durante 
a execução de um programa Java requer algum mecanismo para tratá-los. Este tópico será 
discutido a seguir, 

/** Programa teste para as classes de progressão */ 
class TestProgression [ 
public static void main(Strina[ | args) | 

Progression prog; 

Mesta ArithProgression 

System.out.printin(" Arithmetic progression with default increment :"}; 

prog = new ArithProgressiorn |; 

prog.printProgression(10]; 

System.out.printin(^Arithmetic progression with increment 5:") 

prog = new ArithProgression(5); 

prog.pnntProgressiont 10). 

ff testa GeomProgression 

System.out.printin("Ceometric progression with default base: "|; 

prog = new GeomProgression( |, 

prog.printProgression(1 0); 

System.out.printin(*Geometric progression with base 2: "); 

prog = new GeomProgression(3); 

prog.printProgression(10); 

¿Mesta FibonacciProgression 

System out printi" Fibonacci progression with default start values: "|; 

prog = new FibonacciProgression( |; 

prog. printProgression(10): 

System.out.printin(*Fibonacci progression with start values 4 and 6:"); 

prog = new FibonacciProgresston(d, 6); 

prog.printProgression(10); 


Trecho de código 2.6 Programa para testar as classes de progressão. 


Arithmetic progression with default increment: 
0123456788 

Arithmetic progression with increment 5: 

05 10 15 20 25 30 35 40 45 

Geometric progression with default base: 
1248 16 32 64 128 256 512 
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Geometric progression with base 3: 

13927 81 243 729 2187 6561 19683 
Fibonacci progression with default start values: 
0112358132134 

Fibonacci progression with start values 4 and 6: 
4610 16 26 42 68 110 178 288 


Trecho de código 2,7 Saida do programa TestProgression apresentado no Trecho de código 2.6. 


2.3 Exceções 


As excecoes são eventos inesperados que ocorrem durante a execução de um programa. Uma exce- 
ção pode ser o resultado de uma condição de erro ou de uma simples entrada inesperada, De qual- 
quer forma, em linguagens onentadas a objetos como Java, as exceções são vistas como objetos, 


2.3.1 | Lançando exceções 


Em Java, exceções são lançadas por trechos de código que detectam algum tipo de condição 
inesperada. Podem também ser lançadas pelo ambiente de execução de Java se este encontra 
uma situação imprevista como, por exemplo, execução além da memória de um objeto. Uma 
exceção lançada é capturada por trechos de código capazes de tratar a exceção de alguma forma, 
ou então o programa é encerrado de maneira inesperada. (Trata-se, mais adiante sobre captura 
de exceções. | 

As exceções se originam quando um pedaço de código Java encontra algum tipo de proble- 
ma durante a execução, e langa um objeto de exceção identificado com um nome desentivo. Por 
exemplo, eliminando o décimo elemento de uma sequência de apenas cinco elementos, o código 
irá lançar uma BoundaryViolationException. Esta ação poderia ser executada, por exemplo, pelo 
seguinte trecho de código: 

if (insertindex . 5 А length] } { 

throw new 
BoundaryViolationException(" No element at index * + insertindex); 


} 


Em geral, é conveniente instanciar o objeto de exceção no momento em que a exceção está 
para ser lançada. Desta forma, um comando de lançamento tipico é escrito assim: 


throw new exceplion. Pipel pires, param, spar, |) 


onde exception, type é o tipo da exceção e os "param" formam a lista dos parámetros do cons- 
trutor desta exceção. 

às exceções também são lançadas pelo ambiente de execução de Java. Por exemplo, o equi- 
valente ao caso anterior é ArraylIndexOutOfBoundsException. Se existe um vetor de seis elemen- 
los € solicita-se o nono elemento, esta exceção será lançada pelo ambiente de execução de Java. 


A cláusula throws 


Quando um método é declarado, € adequado especificar os tipos de exceção que ele pode lançar. 
Esta convenção tem tanto um propósito Funcional como de cortesia, porque permite que o usuá- 
rio saiba o que esperar. Além disso, possibilita que o compilador Java saiba para quais exceções 
deve estar preparado. O exemplo seguinte apresenta este tipo de definição de método: 


Projeto Orientado a Objetos 85 


public void goShopping( ) throws ShoppingListTooSmallException, 
OutOfMoneyExcaption | 
¿corpo do método 
| 


Especificando-se todas as exceções que podem ser disparadas por um método, preparam-se 
os outros para lidar com todos os casos excepcionais que podem resultar do seu uso, Outro be- 
neficio da declaração de exceções é que não é necessário capturar essas exceções neste método. 
Algumas vezes 1650 € apropriado, principalmente quando outro código é o responsável pelas 
circunstâncias que podem levar à exceção. 

O exemplo seguinte ilustra uma exceção que é “passada adiante”: 


public void getRieadyForblass( ) throws ShoppinglistlooSmalException, 
QutOfMoneyException | 
goShoppingl |; // Eu não tenho que testar ou capturar exceções 
ff que a função goShopping( ) pode lançar porque 
/! getReadyForClass() passa as mesmas adiante. 
makeCookiesForTA( | 


| 


Uma função pode declarar que é capaz de lançar quantas exceções quiser. Tal lista pode ser 
simplificada, entretanto, se todas as exceções que podem ser lançadas forem subclasses da mes- 
ma. Neste caso, deve-se declarar apenas que o método lança a superclasse adequada. 


Tipos de lançamentos 


Java define as classes Exception e Error como subclasses de Throwable, o que implica que todos 
esses objetos podem ser lançados e capturados. Além disso, define a classe RunTimeException 
como subclasse de Exception. À classe Error é usada para condições anormais que ocorram no 
ambiente de execução. tais como executar sem memória suficiente. Os erros podem ser captu- 
rados mas, provavelmente, nào o serão, porque, em geral, sinalizam problemas que não podem 
ser tratados de forma refinada, Uma mensagem de erro ou a interrupção súbita da execução pode 
ser a melhor saída que se pode esperar messes casos, A classe Exception é a raiz da hierarquia de 
exceções. AS excecóes especializadas (por exemplo, BoundaryviolationException) devem ser de- 
finidas por herança de Exception ou de RunTimeException. Observa-se que as exceções que não 
forem subclasses de RunTimeException devem ser declaradas na cláusula throws de qualquer 
método que possa langá-las. 


2.3.2 Capturando exceções 


Quando uma exceção é lançada, deve ser capturada, ou о programa se encerrará. Uma exceção 
que ocorra em qualquer método pode ser passada pelo método que o ativou ou pode ser por ele 
capturada, Quando uma exceção é capturada, ela pode ser analisada e tratada. À forma geral de 
se lidar com exceções é “tentar”* executar um trecho de código que tenha a possibilidade de 
lançar uma exceção. Se a exceção for lançada, então a mesma será capturada **, fazendo com 
que o fluxo de controle desvie para um bloco catch predefinido, Usando o bloco de eaptura***, 
pode-se então lidar com a circunstância excepcional. 


“Mode T. Analogia com o comando try de Java. 
** Node T. Analogia com o comando catch de Java, 
àrt N, de T. Вико catch 
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А sintaxe genérica para um bloco iry-catch em Java é a seguinte: 


try 
bloco principal de comandos 

catchitipo da exceção, varidvel,) 
bloco de comandos, 

catch tipje da exceção, varidvel,) 
bloco de comandos, 


finally 


bloco de comandos, 


onde deve existir pelo menos uma clausula catch, mas a clausula finally é opcional. Cada fipo 
da exceção € do tipo de alguma exceção, e cada variável é um nome de variável válido em Java. 

O ambiente Java inicia executando um bloco try-cateh como este, pela execução do conjun- 
to de instruções bloc principal de comandos. Se essa execução não gerar exceções, então o 
fluxo de controle continua no primeiro comando após a última linha do bloco try-catch, a menos 
que este inclua o bloco opcional finally. O bloco finally, quando existe, € executado indiferen- | 
temente se as exceções forem lançadas ou capturadas. Então, neste caso, se nenhuma exceção é | 
lançada, a execução segue pelo bloco try-cateh, pula o bloco finally e continua com o primeiro 
comando depois da última linha do bloco try-catch. 

Se, por outro lado, o bloco principal de comandos gera uma exceção, então a execução do 
bloco try-catch termina neste ponto e desvia para o bloco catch mais próximo cujo tipo da 
exceção combinar com a exceção lançada. А varidvel deste comando catch referencia o objeto 
da exceção propriamente dito, que pode ser usado no bloco do comando cateh acionado, Uma 
vez encerrada a execução do bloco catch, o controle é passado рага o bloco opcional finally, se 
ele existir, ou imediatamente para o primeiro comando após a última linha do bloco try-cateh, 
se não existir bloco finally. Caso contrário, se não houver nenhum bloco catch capaz de tratar a 
exceção, então o controle será passado para o bloco opcional finally, se existir, e então a exceção 
é repassada para o método chamador. 

A seguir, será examinado o exemplo do trecho de código: 


int index = Integer MAX VALUE; 4! 2.14 Bilhões 
try (г Este código deve ter problemas... 


{ 
String toBuy = shoppingList[index]; 


| 
catch (ArrayindexCutOfBoundsException айо к) 
{ 


System outprintin("The index "+index+" is outside the array. ”); 


| 


Se este código não capturar a exceção lançada, o fluxo de controle irá sair imediatamente 
do método e retornar para o código que o ativou. Neste ponto, o ambiente de execução de Java 
procurará novamente um catch, Se não existir bloco catch no código que chama este método, o 
fluxo de controle irá pular para o código que o ativa e assim por diante. No caso de nenhum bloco 
de código capturar a exceção, o ambiente de execução de Java (a origem do fluxo de execução do 
programa) irá capturar a exceção. Nesse momento, uma mensagem de erro e o conteúdo da pilha 
são impressos na tela e o programa é encerrado. 

O exemplo que segue é de uma mensagem de erro real: 


java.lang.MullPcinterException: Returned a null tocator 
at java.awt.Component.handleEvent(Component.java-BOQ) 
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at java.awt. Component.postEvent(Component.java:838) 

at java.awt. Component. postEventiComponent.java:845) 

at sun.awt.motif.MButtonPeer. action(MButtonPeer java:39) 
at java.lang. Thread.run(Thread.java) 


Uma vez capturada a exceção, existem várias possibilidades de escolha para o programador. 
Uma delas é imprimir uma mensagem de erro e terminar o programa. Existem casos interessantes 
em que a melhor maneira de tratar uma exceção é ignorá-la (isto pode ser feito com um bloco 
catch vazio). 

Ignorar uma exceção é normal, por exemplo, quando o programador não está preocupado 
com o fato de ocorrerem exceções ou não. Outra forma legítima de tratar uma exceção é criar e 
lançar uma outra, possivelmente alguma que expresse a situação excepcional com maior preci- 
são. O exemplo a seguir apresenta essa situação: 

catch (ArrayIndexOutOfBoundsException aloobx) [ 

throw new ShoppingListTooSmallExceptioni 
"Product index is not in the shopping list™) 


} 


A melhor maneira de tratar uma exceção (embora nem sempre seja possível), porém, é en- 
contrar o problema, consertä-lo e continuar à Execução. 


2.4 Interfaces e classes abstratas 


Para que dois objetos possam interagir, eles precisam “conhecer” as várias mensagens que cada 
um pode aceitar, ou seja, os métodos que cada objeto suporta, Para garantir esse "conhecimen- 
to”, o paradigma de projeto orientado a objetos solicita que as classes especifiquem a interface 
de programação da aplicação (API*), ou simplesmente interface, que seus objetos apresentam 
para os outros objetos. Na abordagem de TADs (ver a Seção 2.1.2) usada para estruturas de 
dados neste livro, uma interface que define um TAD é especificada como uma definição de tipo 
e uma coleção de métodos para esse tipo, com os parâmetros de cada método sendo dos tipos 
determinados. Esta especificação, por sua vez, é garantida pelo compilador ou pelo ambiente de 
execução que requer que os tipos dos parâmetros realmente passados para os métodos confiram 
exatamente com o tipo indicado na interface. Este requisito é conhecido como tipagem forte, Ter 
de definir interfaces e ter que lidar com tipagem forte é uma sobrecarga para o programador, mas 
a tarefa é recompensada porque certifica o principio do encapsulamento e, normalmente, detecta 
erros de programação que de outra forma passariam desapercebidos, 


2.4.1  Implementando interfaces 


O principal elemento estrutural de Java que garante uma API é a interface. Uma interface é uma 
coleção de declarações de métodos sem dados e sem corpo. Ou seja, os métodos de uma interface 
são sempre vazios (ou seja, são simples assinaturas de métodos), Quando uma classe implementa 
uma interface, ela deve programar todos os métodos declarados na mesma. Dessa forma, a inter- 
face impõe que a classe que a implementa tenha métodos com assinaturas específicas. 

Suponha, por exemplo. que se deseja criar um inventário de antiguidades, classificando-as 
como objetos de vários tipos e de várias características, Pode-se, por exemplo, identificar alguns 
dos objetos como vendiveis e, neste caso, podemos implementar a interface Sellable (^vendivel") 
apresentada no Trecho de código 2.8. 


*N.de T. D inglês applicatio programming interface 
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Pode-se então definir uma classe concreta, Photograph (fotografia), apresentada no Trecho 
de código 2.9, que implementa a interface Sellable, indicando que se está disposto a vender 
qualquer um dos objetos Photograph: esta classe define um objeto que implementa cada um 
dos métodos da interface Sellable, como requerido, Além disso, adiciona um método, IsGolor (é 
colorida), específico de objetos Photograph. 

Outro tipo de objeto da coleção pode ser algo que se possa transportar, Para tais objetos, se 
define a interface apresentada no Trecho de código 2,10, 


+ Interfaces para objetos que podem ser vendidos. */ 
public interface Sellable | 


/** descrição do objeto */ 
public String description ): 


/** lista de preços em centavos */ 
public int list Price |: 


/** preço mais baixo em centavos que se pode aceitar */ 
public int lowestPrice |; 


Trecho de código 2.8 Interface Sellabla. 


/** Classe de fotografias que podem ser vendidas. */ 
public class Photograph implements Sellable 
private String descript; V descrição desta foto 
private int price: // preço estabelecido 
private boolean color; — //true se а foto for a cores 


public Photograph(String desc, int p, boolean c) L construtor 
descript = desc; 
price = p; 
color = c; 


| 


public String description() { return descript; } 
public int listPrice( ) { return price; } 

public int lowastPrice( ) | return price/2; } 
public boolean isColor( ) return color; } 


Trecho de código 29 Classe Photograph implementando a interface Sellable. 


1+ Interface para objetos que podem ser transportados. */ 
public interface Transportable | 

/** paso em gramas */ 

public int weight у; 

/** se o objeto é ou nào é perigoso */ 

public boolean isHazardous( }; 
} 


Trecho de código 2.10 Interface Transportable”, 


Pode-se definir então a classe Boxeditem, apresentada no Trecho de código 2.11, para quais- 
quer antiguidades que se possam vender, empacotar e transportar. Dessa forma, a classe Вохесі- 


*N de T. Transporável. 
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tem implementa os métodos da interface Sellable e da interface Transportable, além de acrescen- 
tar métodos especializados para determinar o valor do seguro para o transporte de um pacote e 
para determinar as dimensdes do mesmo. 

pH Classe de objetos que podem ser vendidos, empacotados e despachados. */ 


public class Boxecdltem implaments Sellable, Transportable f 
private String descript; —//daescrigào do item 


private imt price; H preço de tabela em centavos 

private int weight; // peso em gramas 

private boolean haz; true se o objeto for perigoso 

private int height=0; // altura da caixa em centimetros 
private int width=0; // largura da caixa am centimetros 
private int depth=0; +" profundidade da caixa em centimetros 


e Construtor + 
public BoxedltemiString desc, int p, int w, boolean hj { 
descript = desc, 
price = p; 
weight = w; 
haz = h; 


public String description ) [ return descript; ) 
public int listPricei ) { return price: ) 

public int lowestPrice( ) return price/z; | 
public int weight() return weight; } 

public boolean isHazardousí | | return haz; } 
public int insuredValue() { return price^2; | 
public void setBox(int h, int we, int d) [ 


height = №; 
width = чү, 
depth = d; 


| 
| 


Trecho de código 2,11 Classe Boxedltem. 


A classe Boxeditem também apresenta outro recurso de classes e interfaces em Java — uma 
classe pode implementar várias interfaces — o que nos permite grande flexibilidade para definir 
classes que se adaptam a múltiplas APIs. Enquanto uma classe Java só pode estender uma única 
classe, elas podem implementar muitas interfaces, 


2.4.2 Herança múltipla e interfaces 


A habilidade de estender de mais de uma classe é conhecida como herança múltipla. Em Java, 
a herança múltipla é permitida para interfaces, mas não para classes. À razão desta regra É que 
métodos de interfaces não tëm corpos, enquanto que métodos de classes às possuem. Desa firi- 
má, se Java permitisse a herança múltipla para classes, poderia haver confusão caso uma classe 
tentasse estender duas classes que contivessem métodos com a mesma assinatura. Essa confusão, 
entretanto, não existe para interfaces porque os métodos são vazios. Então, como não há confu- 
são possível e existem situações em que a herança múltipla de interfaces é útil, Java as permite. 
Um uso para à herança múltipla de interfaces é uma aproximação da técnica de herança 
múltipla conhecida como mistura. Ao contrário de Java, algumas linguagens orientadas a objetos 
tais como C++ e Smalltalk permitem a herança múltipla de classes concretas, e nào apenas de 
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interfaces. Em tais linguagens, é comum a criação das chamadas classes mistura, que não são 
projetadas para serem instanciadas, mas apenas para proporcionar funcionalidades adicionais a 
classes existentes. Entretanto, tal tipa de herança não é permitida em Java, então os programado- 
res podem se aproximar dela através de interfaces. Pode-se usar a herança múltipla de interfaces 
como um mecanismo para “misturar” os métodos de duas ou mais interfaces nào-relacionadas 
para definir шта outra que combina suas funcionalidades, talvez agregando mais alguns métodos 
próprios. Analisando novamente o exemplo das antiguidades, pode-se definir uma interface para 
descrever itens segurávels, como segue: 


public interface Insurableltem extends Transportable, Sellable { 
//** Retorna o valor segurado em centavos. */ 
public int insuredValue ); 


Esta interface mistura os métodos da interface Transportable com os da interface Sellable, 
e adiciona um método extra, insuredValue. Tal interface permite definir a classe Boxeditem de 
outra forma: 
public class Boxedltem2 implements Insurableltem | 
V „о resto do código fica exatamente como antes 


Neste caso, observa-se que o método insuredValue não é opcional, o que acontecia na decla- 
ração de Boxeditem fornecida anteriormente, 

Entre as interfaces de Java que se aproximam ao conceito da mistura, destacam-se java.lang. 
Cloneable, que acrescenta a capacidade de cópia a uma classe, java.lang.Comparable, a qual 
agrega à capacidade de comparação a uma classe (impondo uma ordem natural à suas instâncias). 
e java util Observer, que adiciona o recurso de atualização a classes que desejam ser notificadas 
quando certos objetos “observáveis” têm seu estado alterado, 


24.3 Classes abstratas e tipagem forte 


Uma classe abstrata é aquela que contém uma declaração de método vazia (isto é, uma declaração 
de método sem implementação, e definições concretas de métodos € variáveis de instância. Por 
1350, uma classe abstrata situa-se entre uma interface e uma classe concreta Da mesma forma que 
uma interface, uma classe abstrata não pode ser instanciada, ou seja, nenhum objeto pode ser cria- 
do a partir de uma classe abstrata. Uma subclasse de uma classe abstrata deve prover a implemen- 
tação dos métodos abstratos de sua superclasse ou será também considerada abstrata. Da mesma 
forma que uma classe concreta, porém, uma classe abstrata A pode estender outra classe abstrata, € 
tanto classes concretas como abstratas podem mais tarde estender A. Por fim, pode-se definir outra 
classe que não é abstrata e estender (subclasses) uma superclasse abstrata, e esta nova classe deve 
fomecer o código de todos os métodos abstratos. Sendo assim, classes abstratas usam а chamada 
herança de especificação, mas também permitem especialização e extensão (ver Seção 2.2.3). 


А classe java.lang. Number 


De fato, já se viu um exemplo de classe abstrata. As chamadas classes numéricas de Java (apre- 
sentadas na Tabela 1,2) especializam uma classe abstrata chamada java. lang. Number. Cada clas- 
se numérica concreta, como java.lang.Integer e java.lang.Double, estendem a classe java.lang. 
Number e implementam os detalhes dos métodos abstratos da superclasse. Em especial, os méto- 
dos intValuae, flaatValue, doubleValue e longValue são todos abstratos na classe java.lang. Number, 
Cada classe numérica concreta deve especificar os detalhes desses métodos. 
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Tipagem forte 


Lima variável de objeto pode ser vista como sendo de vários tipos. O tipo primário de um objeto 
e é a classe C especificada no momento em que o é instanciado, Além disso, o é do tipo de cada 
superclasse $ de C, e do tipo / de cada interface / implementada por C. 

Entretanto, uma variável só pode ser declarada como sendo de apenas um tipo (uma classe 
ou uma interface), o que determina como a variável será usada e como certos métodos irão agir 
sobre a mesma, Da mesma forma, um método tem um único tipo de retomo. Em geral, uma ex- 
pressão tem um tipo único. 

Reforçando o fato de que todas as variáveis são tipadas e que as operações declaram os tipos 
esperados, Java usa a técnica da fipagem forte para auxiliar na prevenção de erros, Mas com exi- 
gências rigidas para tipos, há necessidade de trocar ou converter um tipo em outro, Estas conver- 
sões devem ser especificadas por um operador de conversão. Já se discutiu (Seção 1.3.3) como 
as conversões funcionam para os tipos base, Na sequência, será discutido como elas funcionam 
para variáveis referência, 


2.5 Conversão e genéricos 
Nesta seção, discute-se a conversão entre variáveis releréncia, bem como a técnica conhecida 
como genéricos, que permite que se evite o uso de conversão explícita em muitos casos. 


2.5.1 Conversáo 


A discussão começa pelos métodos de conversão de tipo para objetos, 


Conversões ampliadas 
Uma conversão ampliada ocorre quando um tipo 7 é convertido para um tipo “ampliado” E Os 
casos a seguir são exemplos de conversões ampliadas: 

e Te U sio classes e Ué uma superclasse de T. 

«+ Te U хдо interfaces e U é uma superinterface de T. 

* Té uma classe que implementa uma interface (7. 

Conversões ampliadas são feitas automaticamente para armazenar o resultado de uma expressão 
em uma variável sem a necessidade de conversão explícita, Assim, pode-se atribuir diretamente o 
resultado de uma expressão do tipo Tem uma vanável v do tipo U quando a conversão de T para E 
for uma conversão ampliada. O exemplo do trecho de código que segue mostra que uma expressão 
do tipo Integer (um objeto Integer recém criado) pode ser atribuido a uma variável do про Number. 


Integer | = new Integers); 
Numbern = i; “conversão ampliada de Integer para Number 


A correção de uma conversão ampliada pode ser verificada pelo compilador e sua validade 
não precisa ser testada pelo ambiente de execução de Java durante a execução. 


Conversões reduzidas 
Uma conversão reduzida ocorre quando um tipo T é convertido em um про “reduzido” 5. Os 
casos a seguir são exemplos de conversões reduzidas: 

• TeSsãoclassesc $ é uma subclasse de T. 

a Te 5 são interfaces e 5 é uma sobinterface de 7. 

e Téuma interface implementada pela classe $. 
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Normalmente, uma conversão reduzida de referências requer uma conversão explícita. Além 
disso, a correção de uma conversão reduzida pode não ser verificável pelo compilador. Assim, sua 
validade deve ser testada pelo ambiente de execução de Java durante a execução do programa. 

O exemplo do trecho de código que segue mostra como usar um conversor para executar uma 
conversão reduzida do tipo Number para o tipo Integer. 


Number n = new Integerl2}; /" conversão ampliada de Integer para Number 
Integer i = (Integer) n; — // conversão reduzida de Number para Integer 


No primeiro comando, um objeto novo da classe Integer é criado e atribuído a uma variável 
do tipo Number. Logo, uma conversão ampliada ocorre nessa atribuição, e nenhum conversor é 
necessário. No segundo comando, atribui-se n a variável i do tipo Integer usando um conversor. 
Esta atribuição é possível porque n se refere a um objeto do tipo Integer. Entretanto, como a va- 
riável n é do tipo Number, ocorre uma conversão reduzida e um conversor é necessário 


Exceções de conversão 


Em Java, € possível converter uma referência o do tipo T em um tipo $, desde que o objeto refe- 
renciado por o seja na verdade do tipo 5. Se. por outro lado, o objeto e não for do tipo 5, então 
tentar converter o para o tipo 5 irá causar uma exceção chamada ClassCastExcaption. Esta regra 
ё apresentada no trecho de código que segue: 


Number n; 

Integer i; 

n = new Integeri3}; 

| = (Integer) n; tt 1250 é legal 
п = new Doubled. 1415k 

| = (Integer) п; fi Isso е ilegal 


Para evitar problemas como esse, e evitar ter de poluir o código com blocos try-catch. toda 
à vez que se usa conversões, Java fornece uma maneira de se ter certeza que uma conversão 
de objeto será correta. À saber, é fornecido o operador instanceof, que permite testar se uma 
variável refere-se a um objeto de uma certa classe (ou implementa uma determinada interface). 
A sintaxe para usar este operador é referência para objeto instanceof tipo referenciado, onde 
referência. para. objeto € uma expressão que retorna uma referência para objeto e tipo_referen- 
ciado é o nome de uma classe, interface ou enumeração (Seção 1.1.3) Se referência para objeto 
é também uma instância para epi: referenciado, então à expressão anterior retoma true. Caso 
contrário ela retorna false. Assim, pode-se evitar que uma ClassCastException seja lançada mo- 
dificando o trecho de código como segue: 


Number n; 
integer i; 
n = new Integer(3); 
if (n instanceof Integer) 
| = (Integer) п; #/ lago é legal 
n = new Double(3.1415]; 
if (n instanceof Integer) 
| = (Integer) n; H lago nào será tentado 


Conversões com interfaces 


Interfaces permitem forçar que objetos implementem certos métodos, mas usar variáveis interfa- 
ce com objetos concretos por vezes implica no uso de conversores. Suponha, por exemplo, que se 
deseja declarar à interface Person (“pessoa”) apresentada no Trecho de código 2.12, Observe que 
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o método equalTo da interface Person recebe um parámetro do tipo Person. Logo, pode-se passar 
um objeto de qualquer classe que implemente a interface Person para este método. 


public interface Person ( 
public boolean equalTo (Person other); Esta é a mesma pessoa? 
public String getMamel y, // Retorna o nome desta pessoa 
public int getAge(): // Retorna a idade desta pessoa 


| 
Trecho de código 2.12 Interface Person. 


No Trecho de código 2.13 é apresentada uma classe, Student, que implementa Person, O 
método equalTo assume que o argumento (declarado do tipo Person) é também do tipo Stu- 
dent, e executa uma conversão reduzida do tipo Person (uma interface) para o tipo Student 
(uma classe). Esta conversão é permitida neste caso porque é uma conversão reduzida da 
classe T para uma interface U, onde o objeto obtido de Té tal que T estende 5 (ou T= fjes 
implementa El. 


public class Student implements Person { 

String id; 

String name; 

int age; 

public Student (String i, String n, int a) | // construtor simples 
id = i; 
name - n 
абе = а; 


protected int studyHoursi ) | return age/2; ) // apenas um "chute" 
public String gatlD () ( return id; } // ID do estudante 
public String gaetNamexd | { return name; | // da interface Person 
public int getAgel ) { return age; ) // da interface Person 
public boolean equalTo (Person other) [ // da interface Person 
Student otherStudent = (Student) other; — // converte Person para Student 
return (id.equals (otherStudent.getlD()) // compara os IDs 
| 
public String toString( | { // para impressão 
return "Student (ID: " + id + 
н Mame: " + папе + 
" Age: " + age + "I" 


Trecho de código 2,12 Classe Student que implementa a interface Person. 


Em função da premissa assumida na implementação do método equalTo, é necessário ter 
certeza que uma aplicação que use objetos da classe Student não irá tentar comparar objetos 
Student com outros tipos de objetos, pois, neste caso, a conversão no método equalTo irá falhar. 
Por exemplo, se a aplicação gerencia um diretório de objetos Student e não usa outros tipos de 
objetos Person, então a premissa será satisfeita. 

A capacidade de executar conversões reduzidas de tipos interface para classes permite que se 
escrevam estruturas de dados genéricas que façam apenas suposições mínimas sobre os elemen- 
tos que clas armazenam. No Trecho de código 2,14, esboça-se como construir um diretório de 
pares de objetos que implementam a interface Person. O método remove pesquisa o conteúdo do 
diretório e remove o par de pessoas especificado, se este existir, e, da mesma forma que o método 
findOther, usa o método equalTo para fazê-lo. 
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public class PersonPairDirectory { 
// as variáveis de instância vão aqui 
public PersonPairDirectory() ( /* o construtor default vai aqui */ } 
public void insert (Person person, Person other) [ /* o código de inserção val aqui */) 
public Person findOther (Person person) { return null; | // substituto para find 
public void remove (Person person, Person other) { /* o código de remoção vai aqui */ } 


Trecho de código 2.14 Classe PersonPairDirectary. 


Supondo que se preencha um diretório, myDirectory, com pares de objetos Student que re- 
presentam colegas de quarto, para encontrar o companheiro de um certo estudante, smart one 
("esperto"), pode-se tentar fazer o seguinte (o que está errado): 


Student cute one = myDirectory.findOther(smart, one); // errado ! 


O comando anterior provoca um erro de compilação do tipo "explicit cast reguired””*, O pro- 
blema é que se está tentando fazer uma conversão reduzida sem um conversor explícito. A saber, 
o valor retornado pelo método findOther é do tipo Person, enquanto que a variável cute one, que 
está sendo atribuida, é de um tipo "menor" Student, uma classe que implementa a interface Per- 
son. Logo, usa-se um conversor para converter o оро Person para o tipo Student, como segue: 


Student cute one = (Student) myDirectory.findOther(smart one]; 


A conversão do tipo Person retornado pelo método findOther para o tipo Student funciona 
sempre que houver certeza que a camada para myDirectory.findOther fornece um objeto Student. 
Em geral, interfaces são ferramentas valiosas para o projeto de estruturas genéricas, pois podem 
ser especializadas por outros programadores por meio do uso de conversores, 


2.5.2 Genéricos 


A partir da versão 5.0, Java inclui um framework genérico que permite o uso de tipos abstratos 
de dados de uma forma que evita multas conversões explícitas, Um tipo genérico é um tipo que 
não é definido em tempo de compilação, mas que é especificado em tempo de execução, O fra- 
mework genérico permite que e defina uma classe em termos de um conjunto de parámetros 
de tipo que podem ser usados, por exemplo, para abstrair os tipos de algumas variáveis internas 
Ча classe. Os sinais de maior e menor são usados para delimitar a lista de parâmetros de tipo. 
Ainda que qualquer identificador válido possa ser usado como parâmetro, letras maiúsculas 
individuais são usadas por convenção. Dada uma classe que foi definida com esses parâmetros, 
instancia-se um objeto dessa classe usando-se tipos reais para indicar os tipos concretos à 
serem usados, 

No Trecho de código 2.15 é apresentada a classe Pair, que armazena pares valor-chave, onde 
os tipos da chave e dos valores são especificados pelos parâmetros K e V, respectivamente. O mé- 
todo main cria duas instâncias desta classe, uma para o par String-Integer (para armazenar uma 
dimensão e seu valor, por exemplo) e outra para o par Student-Double (para armazenar a nota de 
um estudante, por exemplo). 
public class Fair K, V. [ 

K key; 
V value; 
public void set(K k, V v) ( 


*М. de T. Requer conversor explícito. 
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key = k; 
value = v, 

} 

public K getKey() ( return key; } 

public Y getValuei ) { return value; | 

public String toStringí ) | 
return "[* + getkey() +*,* + getValue() + "|"; 

| 

public static void main (Stringl ] args) | 
Pair< String. Integer = pairi = new Pair< String Integer=(), 
pair .setinew String(" height"), new Intager(36)); 
System. out. printin(pairt): 
Pair< Student Double> pair? = new Pair Student, Doubla=[): 
pair? .setinew Student("As976","sue",18), new Double(9.5)); 
System.out.printin(pairz); 


Trecho de código 2.15 Exemplo usando a classe Student do Trecho de código 2.13. 


A saída resultante da execução deste método é apresentada a seguir: 


[height, 36] 
[Student/lD: 45976, Name: Sue, Age: 19), 8.5] 


No exemplo anterior, o tipo real do parámetro podia ser qualquer tipo. Para restringir o tipo 
do parámetro real, pode-se usar a cláusula extends, como mostrado na sequência, onde a classe 
PersonPalrDirectoryGeneric é definida em termos do parámetro de tipo genérico P, parcialmente 
especificado, declarando-se que o mesmo estende à classe Person. 


public class PersonPairDirectoryGeneric,P extends Person. [ 
df... ав variáveis de instância vão aquí... 
publie PersonPairDirectoryGenericó | /* o construtor default vai aqui */) 
public void insert (P person, P other) | /* о código de inserção vai aqui */] 
public P findOther (P person) [ return null; } 7 substituta para find 
public void remove (P person, P other) /* o código de remoção vai aqui */ } 


Esta classe pode ser comparada com a classe PersonPairDirectory no Trecho de código 2.14. 
Dada a classe anterior, pode-se declarar uma variável referindo uma instância de PersonPairDi- 
rectoryGeneric, que armazene pares de objetos do tipo Student: 


PersonPairDirectoyGeneric, Student. myStudentDirectory; 


Para esta instância, o método findOther retorna um valor do tipo Student, Logo, o comando 
d seguir, que ndo usa CONYETSOTES, está correto- 


Student cute one 5 myStudentDirectory.findOther(smart ane); 


O framework genérico permite a definição de versões genéricas de métodos. Neste caso, 
pode-se incluir à definição genérica entre os modificadores dos métodos. Por exemplo, na se- 
quência, apresenta-se a definição de um método que compara as chaves de quaisquer dois objetos 
Pair, desde que suas chaves implementem a interface Comparable. 


public static <K extends Comparable, WL, W= int 
comparePairs(Pair K,V- p, Раг М q) [ 
return p.getKey( J.cormpareTo(q.getKey( jb, // a chave de p implementa compareTo 
| 
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Existe um problema importante relacionado aos tipos genéricos, pois os elementos arma- 
zenados em um arranjo não podem ser um variável de tipo ou um tipo parametrizado. Java 
permite que um arranjo seja definido com um tipo parametrizado, mas não permite que um 
tipo parametrizado ѕеја usado para criar um arranjo novo. Felizmente, permite-se que um 
arranjo definido com um tipo parametrizado seja inicializado com um arranjo não paramé- 
trico recém criado. Mesmo assim, este último mecanismo faz com que o compilador de Java 
gere um aviso, porque não é 100% seguro em relação aos tipos. Esta questão é demonstrada 
a seguir: 

public static vold main(String[ ] args) { 

Pair< String Integer =| | a = new Pair[10]; // correto, mas gera um aviso 

Pair<String.Integer>[ ] b = new Pair<String Integer: [10]; // errado !! 

all] = new Pair<String Integer=( }; // cometo 

al0].set(" Dog". 10); i; este comando e o próximo estão corretos 

System.out.printl(^First pair is "-«a[0|getKey(]-", "--a[0].getValue |]; 


2.6 Exercícios 


Para obter ajuda e o código-fonte dos exercícios, visite java.datastructures.net. 


Heforço 


R-2.] Duas interfaces podem estender uma a outra? Por que sim ou por que nào? 
R-2.2 Forneça três exemplos de aplicações críticas de software. 
R-2.3  Fomeça um exemplo de aplicação de software em que a capacidade de adapta- 
ção pode significar a diferença entre um período longo de vendas e a falência. 
R-24 Descreva um componente de um editor de textos com interface GUI (que 
não seja o menu "editar") e os métodos que ele encapsula. 
R-25 Desenhe o diagrama de herança para os seguintes conjuntos de classes: 
e A classe Goat (bode) estende Object, acrescentando uma variável de ins- 
táncia tail е os métodos milki ) e jump )*. 
+ A classe Pig (porco) estende Object, acrescentando uma vanável de irs- 
táncia nose c os métodos eati je wallow )**. 
* A classe Horse (cavalo) estende a classe Object, acrescentando as variá- 
veis de instância height e color e os métodos runi je jump )* **. 
+ A classe Racer (corredor) estende a classe Horse, acrescentando o mélo- 
do raced )* ***, 
+ A classe Equestrian (“cavaleiro”) estende Horse, acrescentando a variá- 
vel de instância weigth e os métodos troti ) e isTrained( )*****. 


R-2.6 Escreva um pequeno trecho de código Java que use as classes de progressão 
da Seção 2.2.3 para encontrar o oitavo valor de uma série de Fibonacci que 
inicia com 2 e 2 como sendo seus dois valores iniciais. 


“Mode T. “Rabo”, “leite” 6 “pular”, respectriarnente, 

**N de T. “Mare”, “comer” с “chafurdar”, respectivamente. 

st ode T. “Altura”, cor . “correr” e “pular”, respectivamente, 
+ M de To “Corrida”, 

tt ode T. "Рево", “tratare “esti treinado”, respectivamente 
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R-2,7 Se forem escolhidos inc = 128, quantas chamadas ao método nextValue 
da classe ArithProgression, da Seção 2.2.3, podem ser feitas antes de ser 
provocado um overflow de inteiro longo? 

R-2,8 Considere uma variável de instância p declarada do tipo Progression, usan- 
do as classes da Seção 2.2.3, Suponha que na realidade p faça referência 
a uma instância da classe GeometricProgression, que for criada usando 
o construtor default. Convertendo p para o tipo Progression e ativando 
p.firstValue(), qual será o valor retornado? Por qué? 

R-2.9 Analise a herança de classes do Exercício R-2.5 e faga d ser uma variável 
objeto do tipo Horse, Se d se refere a um objeto real do tipo Equestrian, ela 
pode ser convertida para a classe Racer? Por que sim ou por que nào? 

R-2,10 Escreva um exemplo de trecho de código em Java que execute uma rete- 
rência para arranjo que possivelmente esteja fora de faixa e, se isso ocor- 
rer, que o programa capture a exceção e imprima a seguinte mensagem 
de erro: 


"Don't try buffer overflow attacks in Java!" 


R-2.11 Analise o seguinte trecho de código extraído de um pacote: 


public class Maryland extends State ( 
Maryland) { /* construtor nulo ® } 
public void printMe( | [ System.out.printin("Read it.*k] 
public static vold main(String] ] args) | 
Region mid = new State }; 
State md = mew Marylandi |; 
Object obj = new Place |: 
Place usa = new Regioni |! 
ma. printer |; 
mid.printhAal y 
(Place) objj.printMe |; 
obj = md; 
(Maryland) obj).printMed ); 
obj = usa; 
(Place) obj).printMe( j; 
usa — md: 
(Pace) usa). printer j 
) 
| 
class State extends Region | 
Stata) (4 construtor nulo */ ] 
public void printMe() ( System.out.printlni^Ship іе. "у } 
} 
class Region extends Place | 
Region) { /* construtor nulo **] 
public void printMe( ) | System.out.printin("Box it."X] 
! 
class Place extends Object [ 
Place( ) { /* construtor nulo */ } 
public void printMe[ ) { System.out.printin(" Buy :-."X] 
) 


O que é exibido após a ativação do método main() da classe Maryland? 
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R-2.14 


-2.16 


Escreva um pequeno método Java que conte o número de vogais em uma 
string 

Escreva um pequeno método Java que remove toda a pontuação de um 
string + armazenando uma frase. Por exemplo, esta operação deve transfor- 
mar а siring "Let's try, Mike" em "Lets try Mike", 

Escreva um pequeno programa que recebe como entrada três inteiros, a, Б 
ec, a partir do console Java e determina se eles podem ser usados em uma 
fórmula aritmética correta (na ordem em que foram fornecidos), como em 


"a +b =g” “a = b соор “arp m р, 
Escreva um pequeno programa que cria uma classe Pair, que armazena dois 
objetos declarados como tipos genéricos. Faça um exemplo de uso deste 
programa criando e imprimindo pares de objetos Pair que contenham cinco 
tipos diferentes de pares, tais como <IntegerString> e <Fioat,Long>. 
Parâmetros genéricos não são incluídos na assinatura da declaração de um 
método, de maneira que não se pode ter métodos diferentes na mesma clas- 
se que tenha diferentes parámetros genéricos mas os mesmos nomes e tipos 
e quantidade de parâmetros. Como se pode alterar a assinatura dos métodos 
em conflito de maneira a contornar esse problema? 


Criatividade 


Explique por que o algoritmo de ativação dinámica de Java que define o 
método que será ativado para uma determinada mensagem со. аб ) nunca irá 
entrarem lago infinito. 

Escreva uma classe em Java que estende a classe Progression, criando uma 
progressão em que cada valor € o módulo da diferença entre os dois valores 
anteriores, Deve-se incluir um construtor que inicie com 2 e 200 como sen- 
do os dois valores iniciais e um construtor parametrizado, que inicie com 
um par de valores informados como iniciais. 


Escreva uma classe em Java que estende a classe Progression, criando uma 
progressão em que cada valor é a raiz quadrada do valor anterior. (Observe 
que não é mais possivel representar os valores como inteiros.) Você deve 
incluir um construtor default que inicie com 65,536 como primeiro valor, e 
um construtor parametrizado que inicie com um valor informado (double) 
como primeiro valor, 

Reescreva todas as classes da hierarquia da classe Progression de forma que 
todos os valores sejam da classe Biglnteger, de maneira a evitar overflows, 
Escreva um programa que consiste de trés classes, A, Be C, tais que B es- 
tende A e C estende H. Cada classe deve definir uma variável de instáncia 
chamada "x" (isto é, cada uma tem sua própria variável chamada x). Des- 
creva uma forma que permita a um método de C acessar e alterar a versão 
da variável x de A sem alterar as versões de B ou C. 

Escreva um conjunto de classes Java que possam simular uma aplicação 
Internet onde um usuário, Alice, periodicamente cria pacotes que deseja 
enviar para Bob, Um processo da Internet esta sempre venficando se Alice 
tem algum pacote para enviar e, se tiver, despacha-os para o computador de 
Bob, e Bob está periodicamente verificando se o seu computador tem um 
pacote de Alice, e, se tiver, lé o mesmo e o deleta, 
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P-2.1 Escreva um programa Java que recebe um documento e exibe um gráfico 
de barras com as frequências de cada letra do alfabeto que aparece no 
documento, 


P.2.2 Escreva um programa Java que simule uma calculadora portátil. O pro- 
grama deve ser capaz de processar entradas tanto de uma GUI como do 
console Java, para acionar os botões e então exibir o conteúdo da tela após 
a execução de cada operação. No mínimo, a calculadora deve ser capaz de 
efetuar as operações aritméticas básicas e as operações zerarlimpar. 

P-2.3 Complete o código da classe PersonPairDirectory do Trecho de código 
2.14, assumindo que pares de pessoas são armazenadas em um arranjo com 
capacidade 1000. O diretório deve manter o registro de quantas pessoas 
estão registradas no momento. 

P.24 Escreva um programa Java que recebe um inteiro positivo maior que 2 
como entrada e exibe o número de vezes que alguém pode, repetidamente, 
dividir este número por 2 antes de obter um resultado menor que 2. 

P.2.5 Escreva um programa Java que “faça troco” O programa deve receber dois 
números como entrada, um o valor pago e o outro o valor devido, Ele deve 
então retornar a quantidade de cada tipo de nota e moeda que deve ser 
devolvido como troco, devido a diferenga entre o que fol pago е o que foi 
cobrado. Os valores das notas e moedas podem ser os do sistema monetário 
de qualquer governo. Tente projetar o programa de maneira que ele retorne 
a menor quantidade de notas e moedas possível. 


Observações sobre o capítulo 


Para uma revisão abrangente dos desenvolvimentos recentes da ciência e da engenharia da com- 
putação, sugere-se The Computer Science and Engineering Handbook [92]. Para mais informa- 
ções sobre o incidente com o Terac-25, ver o artigo de Leveson e Turner [66]. 

Para o leitor preocupado com estudos avançados em programação orientada a objetos, indi- 
cam-se os livros de Booch [14], Budd[17] e Liskov e Guttag[69]. Liskov e Ciuttag [69] também 
oferecem uma análise interessante sobre tipos abstratos de dados, da mesma forma que o artigo 
cientifico de Cardelli e Wegner [20], assim como o capítulo do livro de Demurjian[28] em The 
Computer Science and Engineering Handbook [92]. Padrões de projeto são descritos no livro de 
Gamma er al [38]. À notação dos diagramas de herança de classe que foi utilizada é derivada do 
livro de Gamma et al. 
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3.1 


3.1.1 


Usando arranjos 


Nesta seção, serão exploradas algumas aplicações de arranjos que foram introduzidas na Seção 1.5. 


Armazenando os registros de um jogo em um arranjo 


A primeira aplicação a ser estudada armazena registros em um arranjo = em especial os registros 
dos maiores scores de um videogame. Armazenar registros em um arranjo € um usó Comum рага 
arranjos, e poderia ter-se escolhido armazenar os prontuários de pacientes de um hospital ou os 
nomes dos estudantes de uma аша de estruturas de dados. Em vez disso, optou-se por armazenar os 
registros dos maiores scores por ser uma aplicação simples, mas que apresenta alguns conceitos de 
estruturas de dados importantes que serão usados em outras implementações ao longo deste livro. 

Inicial mente começa-se perguntando o que se deseja armazenar em um registro de score. 
Obviamente, um dos componentes é um inteiro representando o score propriamente dito que se 
pode chamar de score. Seria interessante incluir também o nome da pessoa que obteve o score, 
e que será chamado simplesmente de name. Pode-se continuar acrescentando campos para re- 
presentar a data da obtengáo do score ou estatísticas do jogo que levaram a tal score. Entretanto, 
este exemplo será mantido simples dispondo apenas de dois campos: score e name. No Trecho 
de código 4.1, apresenta-se uma classe Java que representa um registro do jogo. 


public class GameEntry { 
protected String name; // nome da pessoa que obteve o score 
protected int score; i valor do score 
PE Construtor que cria um registro do jogo */ 
public GarneEntry(String n, int 5) { 
name = п; 
ECHO = 5; 
| 
’** Recupera o campo nome */ 
public String qstName( | { return name; ) 
#** Recupera о campo score */ 
public int getScorel ) { return score; | 
Per Retorna uma string com a representação deste registro */ 
public String toString } | 
return "|" + name + ", " + score + "| "| 
} 
) 


Trecho de código 3.1 Código Java da classe GameEntry. Observa-se que foram incluídos mé- 
todos para retornar o nome e o score de um objeto registro, bem como um método que retorna 
uma representação string do mesmo. 


Uma classe para os maiores scores 


suponha que se deseja armazenar os maiores scores em um arranjo chamado entries, À quantida- 
de de scores que se deseja armazenar pode ser 10, 20 ou 50, de maneira que será usado um nome 
simbólico maxEntries, que irá representar a quantidade de scores que se deseja armazenar. Natu- 
ralmente, deve-se atribuir um valor para esta variável, mas, usando a variável ao longo do código, 
esta alteração é fácil de ser feita posteriormente, se for o caso. Define-se então o arranjo, entries, 
para ser um arranjo com comprimento maxEntriés. Inicialmente, este arranjo armazena apenas 
entradas null, mas à medida que os usuários jogam o videogame, preenchem-se as entradas do ar- 
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ranjo com referências para novos objetos da classe GameEntry. Desta forma, é necessário definir 
métodos para atualizar as referências para GameEntry no arranjo entries. 

A maneira de manter as entradas do arranjo organizadas é simples: armazena-se o conjunto 
de objetos GameEntry ordenados pelo valor dos scores, do maior para o menor. Se o número de 
objetos GameEntry é menor que maxEntrias, então deixa-se que as últimas posições do arranjo 
armazenem referências null. Esta abordagem previne que existam células vazias ou “buracos” na 
série contínua de células do arranjo entries que armazena os registros do jogo indexados de O em 
diante, À Figura 3.1 ilustra uma instância desta estrutura de dados, e o código Java correspon- 
dente é fornecido no Trecho de código 3,2, No Exercício C-3.1, explora-se como o acréscimo de 
registros pode ser simplificado para o caso quando não é necessário preservar a ordem relativa. 


== EJ 
[Mike | mj | Pau | 720 | T20 J 4 = 590 Л 


El 


Figura 3.1 Esquema de um arranjo de comprimento 10, armazenando referências para seis 
objetos GameEntry nas células indexadas de O a 5 e com as restantes sendo referências null, 


/** Classe que armazena os maiores scores em um arranjo em ordem não decrescente */ 


public class Scores [ 
public static final int maxEntries = 10; // Quantidade de scores que serão armazenados 
protected int numEntries; // número real de registros 


protected GameEntry| | entres; “arranjo de registros (nomes & scores) 
/** Construtor default */ 
public Scores() ( 
entries = new GameEntry[maxEntrias]; 
numEntries = 0; 
) 
/** Retorna uma representação string da lista de scores */ 
public String toString( ) { 
String Бы" [н+ 
for (int i = 0; i = numEntries; i++) | 
H (| > 0) s +=", "; 4 separa os registros por virgulas 
8 += entriesli]; 
| 
returns + "1"; 


H... os métodos para atualizar o conjunto de scores vào aqui... 


} 
Trecho de código 3.2 Classe para manter um conjunto de objetos GameEntry. 
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Nota-se que foi incluído um método, toString( ), que produz uma representação string dos 
maiores scores armazenados no arranjo entries. Este método é muito útil para depuração, Neste 
caso, a string será uma lista, separada por vírgulas, dos objetos GameEntry armazenados no ar- 
ranjo entries. Esta lista é produzida por um laço for simples. que acrescenta uma virgula antes de 
cada registro que antecede ao primeiro. Com tal representação string, pode-se imprimir o estado 
do arranjo entries durante a depuração, de maneira a testar como estão as coisas antes e depois 
das atualizações. 


Inserção 


Uma das atualizações mais comuns que se deseja fazer com o arranjo entries dos scores mais al- 
tos é o acréscimo de um novo registro. Supondo que se deseja inserir um novo objeto GameEntry, 
e. Neste caso, levaremos em consideração como será executada a seguinte operação de atualiza- 
ção sobre uma instância da classe Scores: 


add(e): insere o registro e na coleção de maiores scores. Se a coleção está 
cheia, então e é acrescentado apenas se o seu score é maior que o me- 
nor score armazenado no conjunto e, neste caso, e substitui a entrada 
com menor score. 


O maior desafio para implementar esta operação é descobrir onde e deve entrar no arranjo 
entries, e abrir espaço para e. 


Visualizando a inserção de um registro 


Para visualizar o processo de inserção, imagina-se que o arranjo entries armazena controles re- 
motos que representam referências para objetos GameEntry que não são nulos, listados da es- 
querda para direita, do maior para o menor score. 

Dado o novo registro, e, é necessário determinar a que posição ele pertence. Inicia-se esta 
pesquisa pelo final do arranjo entries. Se a última referência do arranjo não é null, e seu score 
é maior que o score de e, então pode-se parar por ai. Neste caso, e não é um dos maiores scores 
- ele não deve pertencer ao arranjo de maiores scores. Caso contrário, sabe-se que e deve per- 
tencer ao arranjo, e também sabe-se que o último registro armazenado no arranjo não deve mais 
pertencer ao mesmo. Na seqüéncia, move-se para a penúltima referência do arranjo. Se esta 
referência é null, ou aponta para um objeto GameEntry cujo score é menor que o referenciado 
por e, esta referência deve ser movida uma célula para a direita. Além disso, se esta referência foi 
movida, então é necessário repetir esta comparação com a próxima célula, desde que ainda não 
tenha sido encontrado o ínicio do arranjo. Continua-se comparando e deslocando as referências 
para os registros até atingir o início do arranjo ou até comparar o score de e com um score maior. 
Neste caso, idenficou-se a posição a qual e pertence (ver Figura 3.2). 

Uma vez que foi identificado o lugar do arranjo entries ao qual o objeto e pertence, arma- 
zena-se a referência e nesta posição. Sendo assim, entendendo as referências para objetos como 
controles remotos, acrescentou-se um controle remoto especialmente projetado para e nesta po- 
sição do arranjo entries (ver Figura 3,3). 

Os detalhes do algoritmo para acrescentar um registro novo e no arranjo entries são similares 
a esta descrição informal, e são fornecidos em Java no Trecho de código 3.3. Observa-se o uso de 
um laço para mover as referências. O número de vezes que se executa este laço depende do mú- 
mero de referências que é necessário mover para abrir espaço para o registro novo. Se existem 0, 
1 ou mesmo poucas referências para mover, este método add será muito rápido. Mas se existirem 
várias para mover, então este método pode se tornar um tanto lento. Observa-se também que se 
o arranjo está cheio, e se executa um add sobre o mesmo, ou será removida a referência para o 
último registro do arranjo ou a inserção do novo registro, e, irá falhar. 
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Figura 3.2 Preparando para acrescentar um novo objeto GameEntry no arranjo entries. De 
maneira a abrir espaço para nova referência, deve-se deslocar as referências dos registros com 
scores menores que o do novo uma célula para a direita. 


Figura 3.3  Acrescentando uma referência para um novo objeto GameEntry ao arranjo entries. 
A referência foi inserida no índice 2, uma vez que todas as referências para objetos GameEntry 
com scores menores que o do registro novo foram deslocadas para a direita. 


/** Tenta inserir um novo score na colação (se ele for grande o suficiente) */ 
public void add(GameEntry e) { 
int newScore = e.geiScorei |; 
¿fo novo registro e corresponde mesmo a um dos maiores scores? 
if (numEntries == maxEntries) { // о aranjo está cheio 
if (newScore <= entries[numEntries — 1].getScore( |) 
return; // neste caso, a nova entrada, e, nào é um dos maiores scores 
) 
else // o arranjo não está cheio 
numEntries ++; 
// localiza o lugar onde o novo registro e (com score grande) deve ficar 
int i = numEntries— 1: 
for ( ; (i >= 1) && (newScore > entries[i— 1].getScore( j); i- =) 
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entries[i] = entries — 1]; ‘move a entrada i| uma posição para direita 
entries[i] = e; ¿facrescenta o novo score as entradas 
} 
Trecho de código 33 Código Java para inserção de um objeto GameEntry. 
Remoção de objetos 


Suponha que um expert use o videogame e coloque seu nome na lista de melhores scores. Neste 
саѕо, será necessário dispor de um método que permita remover um registro desta lista, Por essa 
razão, será analisado como remover uma referência para um objeto GameEntry do arranjo entries. 
Isto é, será analisado como se pode implementar a operação que segue: 


removeli remove e retorna o registro e de indice i do arranjo entries. Se o indice 
restiver fora dos limites do arranjo, então este método lança uma exce- 
ção; caso contrário, as entradas do arranjo são atualizadas de maneira 
a remover o objeto sob o indice i, e todos os objetos anteriormente 
armazenados em índices mais altos que i são “movidos” de manema a 
preencher a posição liberada pelo objeto removido, 


Esta implementação de remove usa um algoritmo semelhante ao de inserção de objetos, po- 
rém ao contrário. Novamente, pode-se entender o arranjo entres como um arranjo de controles- 
remotos que apontam para objetos GameEntry. Para remover a referência para o objeto no índice 
i, começa-se pelo índice ie move-se todas as referências armazenadas em índices mais altos que 
i uma célula para a esquerda. (ver a Figura 3.4). 


Alguns detalhes sutis sobre remoção de registros 


Os detalhes da execução de uma operação de remoção possui alguns aspectos sutis. O primeiro é 
que para remover e retornar © registro (identificado como e), localizado sob o indice | no arranjo, 
deve-se primeiramente salvar e em uma variável temporária. Usa-se esta variável para retornar 
e quando à remoção estiver completa, O segundo aspecto sutil é que, movendo as referências 
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Figura 34 Esquema da remoção do índice 3 em um arranjo que armazena referências para 
objetos GameEntry. 
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maiores que i uma célula para a esquerda, não se val até o fim do amango — pára-se na penúltima 
referência. Para-se antes do fim porque a última referência não tem nenhuma referência a sua 
direita (consequentemente, não existe referência a ser movida para a última posição do arranjo 
entries). No lugar da última referéncia, é suficiente simplesmente se atribuir nulo para a mesma. 
Conclui-se retornando a referência para o registro removido (que não possui mais nenhuma refe- 
rência apontando para o mesmo no arranjo entries). Ver o Trecho de código 3.4. 


/** Remove e retorna o score armazenado no indice i */ 
public GameEntry remove(int i) throws IndexOutOfBoundsException [ 
if (i < 0) | | (1 >= numEntries)) 
throw new IndexOutOTBoundsExceptionl" Invalid index: " + il; 
GameEntry temp = entries[i]; // armazena temporariamente o objeto a ser removido 
for (int | = i; | << numEntrias — 1; ++) // conta a partir de é 


entries[j] = entries[j41]; // move uma célula para esquerda 
entriesíInumEntries — 1 ] = null; anula o último score 
numEntries 
return temp; // retoma o objeto removido 


Trecho de código 34 Código Java para a execução da operação de remoção. 


Estes métodos de adição e remoção de objetos em um arranjo de maiores scores são siti- 
ples. Entretanto, eles formam a base das técnicas que são usadas de forma repetida para cons- 
truir estruturas de dados mais sofisticadas, Naturalmente, essas outras estruturas são mais ge- 
néricas que a estrutura de arranjo descrita, e normalmente oferecerão muito mais operações 
do que o que se pode fazer com apenas add e remove. Porém, estudar a estrutura de dados 
concreta do arranjo, como está sendo feito agora, é um ótimo ponto de partida para se entender 
as demais estruturas, uma vez que todos as estruturas de dados são implementadas a partir de 
dados concretos. 

Na verdade, mais adiante neste livro, será estudada uma das classes de coleções de Java, 
ArrayList. que é mais geral que a estrutura de arranjo analisada aqui. A classe ArrayList tem 
métodos para fazer uma série de coisas que se deseja fazer com um arranjo, além de eliminar 
os problemas que ocorrem quando se acrescenta um objeto em um arranjo cheio. O ArrayList 
elimina este erro copiando automaticamente os objetos em um arranjo maior. Em vez de discutir 
esse processo aqui, entretanto, será visto mais sobre como isso é feito quando a classe ArrayList 
for analisada em detalhes, 


3.1.2 — Ordenando um arranjo 


Na seção anterior, trabalhou-se intensivamente para mostrar como acrescentar ou remover obje- 
tos em um determinado indice г de um arranjo, mantendo a ordenação dos objetos, Nesta seção, 
será estudada uma maneira de iniciar com um arranjo contendo objetos que estão fora de ordem, 
e então colocá-los em ordem. Isso é conhecido como o problema da ordenação. 


Um algoritmo de inserção ordenada simples 


Serão estudados diversos algoritmos de ordenação neste livro, a maioria no Capítulo 11. Para 
introduzir o assunto, entretanto, nesta seção será descrito um algoritmo de ordenação simples 
chamado de inserção ordenada. Neste caso, descreve-se uma versão específica do algoritmo 
onde a entrada é um arranjo de elementos comparáveis. Categorias mais gerais de algoritmos de 
ordenação serão consideradas posteriormente neste livro. 
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O algoritmo de ordenação simples funciona como segue. Inicia-se com o primeiro caracte- 
re do arranjo. Um caractere por si só já está ordenado. Então, considera-se o próximo caractere. 
Se for menor que o primeiro, então invertem-se as posições de ambos. Na sequência, conside- 
ra-se o terceiro caractere do arranjo. Desloca-se o mesmo para a esquerda até que esteja na po- 
sição cometa em relação aos dois primeiros, Considera-se então o quarto caractere, e desloca-se 
o mesmo para а esquerda até que esteja па posição correta em relação aos outros trés. Conti- 
nua-se procedendo desta forma com o quinto, o sexto e assim por diante, até que todo o arranjo 
esteja ordenado. Combinando esta descrição informal com construções de programação, pode- 
se expressar o algoritmo de inserção ordenada como apresentado no Trecho de código 3.5. 


Algoritmo InsertionSortAÃ) 
Entrada: Um arranjo À com a elementos comparáveis 
Saida: O arranjo À com elemento reorganizados em ordem não decrescente 


Para i + 1 atén — | faça 


Inserir Ali] na localização correta dentre AJO], ALT], … Ali — 1]. 


Trecho de código 3.5 Descrição de alto nível do algoritmo de inserção ordenada. 


Esta é uma boa descrição de alto nível do algoritmo de inserção ordenada. Ela demonstra 
também por que o algoritmo é chamado de “inserção ordenada”: porque cada interação do laço 
principal insere o próximo elemento na parte ordenada do arranjo que vem antes dele. Antes que 
se possa codificar esta descrição, entretanto, ё necessário trabalhar melhor os detalhes da opera- 
ção de inserção. 

Aprofundando um pouco mais esses detalhes, esta descrição será reescrita usando dois laços 
aninhados. O lago mais externo considera um elemento do arranjo de cada vez, e o laço mais 
interno desloca o elemento para a localização adequada no subarranjo (ordenado) de caracteres, 
que está a sua esquerda. 


Refinando os detalhes da insercáo ordenada 
Refinando os detalhes, então, descreve-se o algoritmo como apresentado no Trecho de código 3.6. 


Algoritmo InsertionSort(A) 
Entrada: Um arranjo A com n elementos comparáveis 
Saída: O arranjo A com elemento reorgantzados em ordem não decrescente 
Para i + 1 atén — | faça 
| Inserir AL] na localização correta dentre A[O], ATI... Ali — 1]. ] 
curd Ali] 
pei] 
Enquanto j = Oe alí] > cur faça 
А1 AL 
jeej | 
AU + 1] & cur [cur agora está na posição correta | 


Trecho de código 3.6 Descrição de nível intermediário do algoritmo de inserção ordenada. 


Esta descrição está muito mais próxima do código real, uma vez que explica melhor como 
inserir o elemento Ali] no subarranjo que o antecede. Ele ainda usa uma descrição informal da 
movimentação dos elementos se eles estiverem fora de ordem, mas isso não é uma coisa muito 
difícil de resolver, 
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Descrição Java da inserção ordenada 


Agora, pode-se apresentar o código Java para esta versão simples do algoritmo de inserção or- 
denada. Apresenta-se esta descrição no Trecho de código 3.7, para o caso especial em que A é o 
arranjo de caracteres a. 

/** Inserção ordenada de um arranjo de caracteres em ordem não decrescente */ 

public static void insertionsortichar| | a) { 


int n = a.length; 
for (inti = 1; i = m i++) if indice do segundo caracter em a 
char cur = ali; // o caracter corrente a ser inserido 
intj-i— 1; if inicia comparando a célula a esquerda de i 
while ((j >= 0) && (а > cur} 4 enquanto af] está fora de ordem em relação a cur 
а + 1] = ali – —]; і! move alj] para a direita e decrementa | 
alj + 1]=cur; este é o local correto de cur 
} 
} 
Trecho de código 3.7 Código Java para executar a inserção ordenada sobre um arranjo de 
caracteres. 


A Figura 3,5 ilustra um exemplo de execução do algoritmo de inserção ordenada. 

Algo interessante ocorre com este algoritmo se o arranjo já está previamente ordenado. 
Neste caso, o lago interno faz apenas uma comparação, verifica que não é necessária nenhuma 
troca e retoma para o laco mais externo. Isto é, executa-se apenas uma iteração do laço mais 
interno para cada iteração do laço mais externo. Assim, neste caso, executa-se o número minima 
de comparações. Naturalmente, tem-se muito mais trabalho quando o arranjo está completa- 
mente desordenado. Na verdade, a maior carga de trabalho irá ocorrer se o arranjo estiver em 
ordem decrescente. 


3.1.3 Métodos de java.util para arranjos e números aleatórios 


Como arranjos são extremamente importantes, Java fomece uma grande quantidade de métodos 
predefinidos que executam tarefas comuns sobre arranjos. Estes métodos apresentam-se como 
métodos estáticos da classe java.util.Arrays. Isto €, eles estão associados a classe java util. Arrays 
propriamente dita, e não com uma instância particular da classe. À descrição de alguns destes mé- 
todos, entretanto, terá de esperar até que os conceitos em que são baseados sejam estudados, 


Alguns dos métodos mais simples de java.util, Arrays 
São listados a seguir alguns dos métodos mais simples da classe Java.util.Arrays que não neces- 
sitam maiores explicações: 


equals(A, В): retorna true se e somente se os arranjos A e B são iguais, Dois arranjos 
são considerados iguais se eles têm o mesmo número de elementos, e 
todo par correspondente de elementos nos dois arranjos é igual. Isto é, 
A e B tem os mesmos elementos na mesma ordem. 


ПСА, xr armazena o elemento x em todas as células de A. 
sort(4) ordena o arranjo À usando a ordenação natural de seus elementos. 
toString(.A): retorna a representação de A sob a forma de uma string. 
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Figura 3.5 Execução do algoritmo de inserção ordenada sobre um arranjo de oito caracteres. 
Apresenta-se a parte completa (ordenada) do arranjo em branco e colore-se o próximo elemento 
a ser inserido na parte ordenada com cinza claro, Destaca-se, também, o caractere na esquerda, 
uma vez que ele é armazenado na variável cur. Cada linha corresponde a uma iteração do laço 
mais externo e cada cópia do arranjo em uma mesma linha corresponde a uma iteração do laço 
mais interno. Cada comparação é indicada com um arco. Além disso, indica-se quando o resulta- 
do de uma comparação resulta em movimentação ou não. 


Por exemplo, a string a seguir será retornada pelo método toString ativado sobre o arranjo de 
inteiros A = [4,5,2,3,5,7, 10]: 
[4,5,2,3,5,7,10] 


Observa que, pela lista anterior, Java possui um algoritmo de ordenação predefinido. Este, 
entretanto, não é o algoritmo de inserção ordenada apresentado anteriormente. É um algoritmo 
chamado de quick-sort, que normalmente executa muito mais rápido que o de inserção ordenada. 
O algoritmo quick-sort será estudado na Seção 11.2. 


Um exemplo usando números pseudo-aleatórios 


No Trecho de código 3.8 é apresentado um pequeno (mas completo) programa Java que usa os 
métodos listados. 
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import java.util.Arrays; 

import java.util. Random; 

/** Programa que apresenta alguns usos para arranjos */ 

public class ArrayTest | 
public static void main(String ] args) | 
int num[] = new int[10]; 
Handom rand = new Random |: // Um gerador de números pseudo-aleatórios 
rand.setSeed(System.currentTimeMIillis( j; // usa o tempo corrente como semente 
i preenche o arranjo com números pseudo-aleatórios entre О е 99, inclusive 
for (int = 0; i = num.length:; i++) 

numli] = rand.nextint(100); // o próximo número pseudo aleatório 

int| ] old = (int[ ]) num.clone( ); !/ clona о arranjo num 
System.out.println"arrays equal before sort: " + Arrays.equals(old,num)}; 
Arrays.sortinumj; // ordena o arranjo num (old não è modificado) 
System.out.printin("arrays equal after sort: " + Arrays equaisiold,num)); 
System.out.printin("old = * + Arays.toString(old)); 
System.out.printin("rum = " + Arrays.toStringinumi); 
} 

} 


Trecho de código 3.8 Programa teste АггауТевї que usa vários dos métodos predefinidos da 
classe Array. 


O programa Array Test usa outro recurso de Java — a habilidade de gerar números pseudo-ale- 
atórios, isto €, números que são estatisticamente aleatórios (mas não verdadeiramente aleatórios). 
Neste caso, usa o objeto Java.util. Random, que é um gerador de números pseudo-aleatórios, 
isto é, um objeto que calcula ou “gera” uma sequência de números que são estatisticamente 
aleatórios. Tal gerador necessita, entretanto, de um ponto para começar, chamado de semente. A 
sequência de números aleatórios para uma dada semente será sempre à mesma. Neste programa, 
a semente escolhida é o tempo decorrido em milissegundos a partir de 1º de janeiro de 1970 
(usando o método System.currentTimeMilis), que será diferente cada vez que o programa for 
executado, Uma vez selecionada a semente, pode-se repetidamente obter um número randômico 
entre 0 e 99 chamando-se o método nextint com o argumento 100, Na seqüéncia, apresenta-se um 
exemplo de saída deste programa: 


arrays equal before sort: true 
arrays equal after sort: false 


old = [41,38,48,12,28,46,33,19,10,58] 
num — [10,12,19,28,33,38,41,46,48,58] 


A propósito, existe uma pequena chance dos arranjos old e num permanecerem iguais após a 
ordenação de num, que é o caso em que num já estiver ordenado antes de ser clonado, A chance 
disso ocorrer, entretanto, é menor que uma em quatro milhões. 


3.1.4 Criptografia simples com strings e arranjos de caracteres 


Uma das aplicações primárias de arranjos é à representação de strings de caracteres. Isto é, obje- 
tos strings são normalmente armazenados internamente como um arranjo de caracteres. Mesmo 
que strings possam ser representadas de alguma outra forma, existe uma relação natural entre 
strings e arranjos de caracteres — ambos usam índices para referenciar os caracteres. Em função 
desse relacionamento, Java torna simples a criação de strings a partir de arranjos de caracteres e 
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vice-versa. Mais especificamente, para cnar um objeto da classe String a partir de um arranjo de 
caracteres A, simplesmente usa-se a expressão, 


new String(A ) 


Isto é. um dos construtores da classe String recebe um arranjo de caracteres como argumento 
e retorna um string 20m os mesmós caracteres € na mesma ordem que o arranjo. Por exemplo, i 
string que será criado a partir do arranjo A = [a, c, a, t] é acat. Da mesma forma, dada uma string 5, 
pode-se criar uma representação sob a forma de arranjo de caracteres para 5 usando a expressão, 


4 toCharArray( | 


Isto é, a classe String tem um método toCharArray que retorna um arranjo (do tipo char |) 
com os mesmos caracteres que 5. Por exemplo, se toCharárray for ativado sobre o string adog. 
será obtido o arranjo В = fa, d, о, gl. 


A Cifra de César 


Uma área onde é útil ter a capacidade de alternar entre uma string e um arranjo de caracteres е 
de volta novamente é em criptografia, a ciência das mensagens secretas e suas aplicações. Este 
campo estuda formas de executar criptografia. que recebe uma mensagem. chamada de texto 
limpo c converte o mesmo em uma mensagem misturada, chamada de texto cifrado. Da mesma 
forma, a criptografia também estuda maneiras de fazer a decriptografia, que recebe um texto 
cifrado e retorna o texto limpo original. 

Discutivelmente, o esquema de criptografia mais antigo é a Cifra de César, que recebeu este 
nome em homenagem a Julio César, que usou este esquema para proteger importantes mensagens 
militares (todas as mensagens de César eram escritas em Latim. naturalmente, o que as tornava 
incompreensíveis para a maioria das pessoas) A Cifra de César é uma maneira simples de con- 
fundir uma mensagem escrita em uma linguagem que forma palavras a partir de um alfabeto, 

A Cifra de César implica em substituir cada letra de uma mensagem pela letra que está a 
três letras de distância no alfabeto da língua. Assim, em uma mensagem em inglês, substitui-se 
cada À por um D, cada B por um E, cada € por um F, е assim por diante. Continua-se com esta 
abordagem até o W, que é substituido pelo Z. Então, faz-se o padrão de substituição girar, subs- 
tituindo-se o X por A, o Y por Beo Z por C. 


Usando caracteres como indices de arranjo 


Se as letras forem numeradas como se fossem os indices de um arranjo, então A corresponde a 0, В à 
|, Ca 2, е assim por diante, e então se pode escrever a Cifra de César como uma fórmula simples: 


Substitua cada letra é pela letra (1 + 3) mod 26, 


onde mod é o operador módulo, que retorna o resto de uma divisão inteira. Este operador é deno- 
tado 56 em Java, e é exatamente o operador necessário para facilitar o "giro" ao redor do fim do 
alfabeto. Para 26 mod 26, a resposta é 0, 27 mod 26 resulta 1 e 28 mod 26 resulta 2. O algoritmo 
de decnptografia para a Cifra de César é exatamente o contrário: substitui-se cada letra por uma 
três posições antes com o “giro” para A, B e C. 

Pode-se capturar esta regra de substituição usando arranjos para encriptar e desencriptar, 
Uma vez que todo caractere em Java é, na verdade, armazenado como um número = seu valor 
Unicode ~ pode-se usar letras como indices de um arranjo, Para um caractere c marúsculo, por 
exemplo, pode-se usar c como índice de arranjo pegando o valor Unicode de с e subtraindo A. 
Naturalmente, isso funciona apenas para letras maiúsculas, de maneira que será necessário que 
as mensagens secretas sejam maiúsculas. Pode-se então usar um arranjo encrypt, que representa 
a regra de criptografia, de maneira que encrypt[i] contém a letra que substitui a letra número i 
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(que corresponde à c — A para um caractere maiúsculo em Unicode). Este uso é demonstrado na 
Figura 3.6. Da mesma forma, um arranjo, decrypt, pode representar a regra de descriptografia, de 
maneira que decrypt[i] contém a letra que substitui a letra número i. 


ER Carn ZIAIBIC 
Eje A] = [der PASA 


& 7T B 9 10 it 12 A 14 15 16 17 18 19 20 21 22 24 24 25 


Usando 'N' como Índice ——* М - “A 


— = 78 - 85 n Estedo 
Em Unicode  .— substituto de 'N' 


Figura 3.6 Demonstração do uso de caracteres maiúsculos como indices de arranjos. Neste 
caso, para executar a regra de substituição do mecanismo de criptografia da Cifra de César. 


No Trecho de código 3.9, fomece-se uma classe Java simples, mas completa, para executar a 
Cifra de César, que usa a abordagem apresentada e também faz uso das conversões entre strings 
e arranjos de caracteres. Quando se executa este programa (para executar um teste simples), o 
resultado é a seguinte saída: 


Encryption order = DEFGHIJKLMMOPORSTUVWKYZAEC 
Decryption order = XYZABCDEFGHIJELMNOPQRSTUVMW 
HEH HDJIOH LV LO SODE; PHHW DW MRH'V, 
THE EAGLE IS IN PLAY; MEET AT JOE'S, 


/** Classe para criptografar e descriptografar usando a Cifra de César. */ 
public class Caesar { 
public static final int ALPHASIZE = 26; //Alfabeto em inglés (somente letras maiúsculas) 
public static final char[] alpha = ('A', 'B', "С", 'D', СЕ", 'F', 'G', Н", "Т", 
Т.Е, EM AOS PO EL mg. wv ws E E 
protected char] ] encrypt = new char[AL PHASIZE]; // Encryption array 
protected char] ] decrypt = new char[ALPHASIZE]; // Decryption array 
/** Construtor que inicializa os arranjos de criptografar e descriptografar */ 
public Caesar( ) | 
for (int ¡=0; ic ALPHASIZE; i++) 
encrypt[i] = alpha[(i + 3) % ALPHASIZE]; // gira o alfabeto 3 posições 
for (int iz0; ic ALPHASIZE; i++) 
decrypt[encrypt[i] — 'A'] = alpha[i]; // descriptografar é o contrário da criptografia 


! 
/** Método de criptografia */ 


public String encrypt(String secret) [ 
char[ ] mess = secret. toCharArray(; ¿fo arranjo com a mensagem 
for (int i=0; i« mess. length; i++) // lago de criptografia 

if (Character.isUpperCase(mess[i])) // tem-se uma letra para trocar 
mess[i] = encrypt[mess[i] = "AT; if usa a letra como indice 

return new Stringímess); 

} 

/** Método de descriptografar */ 

public String decrypt(String secret) [ 
char[ | mess = secret.toCharArray( |; ¿Fo arranjo com a mensagem 
for (int i-0; i<mess. length; ++) if laço de descriptografar 


if (Character. isUppertase(mess][i])) ff tem-se uma letra para trocar 
mess[i] = decrypt[mess[] — 'a']; // usa a letra como indice 
return new Stringímess); 
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} 

2 Um método main simples para testar a Cifra de César */ 

public static void main(String[ | args) 1 
Caesar cipher = new Caesari ); // Спа um objeto com a Cifra de César 
System.out.printin(^ Encryption order = " + new String(cipher.encrypt)): 
System.out.printin*Decryption order = " + new String(cipher.decrypt)) 
String secret = "THE EAGLE IS IN PLAY; MEET AT JOE'S, 
secret = cipher.encryptisecrety 
oystem.out.printin(secrat); // o texta cifrado 
secret = cipher.decrypilsecrat); 
System.out.printin(secrat); // deve ser texto limpo novamente 


Trecho de código 3.9 Uma classe Java simples, mas completa, para a Cifra de César. 


Arranjos bidimensionais e jogos de posicáo 


Muitos jogos de computador, sejam eles de estratégia, de simulação ou de conflito, usam um ta- 
buleiro bidimensional. Programas que lidam com tais fogos de posição necessitam uma maneira 
de representar objetos em um espaço bidimensional. Uma forma natural de fazer isso é usando 
um arranjo de duas dimensões, onde se usam dois indices, por exemplo, ie j, para referenciar as 
células do arranjo. O primeiro índice normalmente se refere a um número de linha, e o segundo 
a um número de coluna, Dado tal arranjo, pode-se manter tabuleiros bidimensionais, hem como 
executar outros tipos de cálculos envolvendo os dados armazenados nas linhas e colunas. 

Arranjos em Java são unidimensionais; usa-se um único indice para acessar cada célula do 
arranjo. Apesar disso, existe uma maneira de definir arranjos de duas dimensões em Java — pode- 
se criar um arranjo de duas dimensões como um arranjo de arranjos. Esto é, pode-se definir um 
arranjo bidimensional como sendo um arranjo onde cada uma de suas células é outro arranjo. Tal 
arranjo bidimensional € por vezes chamado de matriz. Em Java, declara-se um arranjo bidimen- 
sional como segue: 


int] |] = new int[B][10]; 


Este comando cria um “arranjo de arranjo” de duas dimensões, Y, que é 8 X 10, tendo 8 li- 
nhas e 10 colunas, Isto с, é um arranjo de comprimento 8 onde cada elemento de Y é um arranjo 
de comprimento 10, de inteiros. (Ver a Figura 3.7.) О que segue são usos válidos рага o arranjo 
Y c as variáveis int, ie |; 

ҮШ + 1] = Y) + 3; 

і = alength; 

| = Ya length; 


Arranjos bidimensionais tëm várias aplicações em análise numérica. Em vez de entrar em 
detalhes sobre tais aplicações, entretanto, explora-se uma aplicação de arranjos de duas dimen- 
sões para implementar um jogo posicional simples. 


Jogo da Velha 


Como todas as crianças em idade escolar sabem, o fogo da velha é um jogo que se joga em um tabu- 
leiro de 3 por 3 posições. Dis jogadores = X e O = se alternam colocando suas respectivas marcas 
nas células deste tabuleiro, iniciando pelo jogador X. Se um dos jogadores for bem-sucedido em 
obter trés de suas marcas em uma linha, coluna ou diagonal, então será o vencedor. 
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Figura 3.7 Demonstração de um arranjo bidimensional Y que tem 8 linhas e 10 colunas. O 
valor Y[3][ 5] € 100 € o valor Y[6][2] é 632. 


Este realmente não é um jogo posicional muito sofisticado, e não é muito divertido de jogar, 
pois um bom jogador sempre pode forçar o empate. À graça do jogo da velha está no fato de que 
é um exemplo simples para demonstrar como arranjos de duas dimensões podem ser usados em 
jogos de posição. Programas para jogos posicionais mais complicados tais como damas, xadrez 
ou os populares jogos de simulação são todos baseados na mesma abordagem apresentada aqui 
para o jogo da velha. (ver o Exercício P-7.8) 

A idéia básica é usar um arranjo bidimensional, board, para manter o tabuleiro do jogo. As 
células deste arranjo armazenam valores que indicam se a célula está vazia ou armazena um X 
ou О. Isto é, board é uma matriz 3 x 3, cujas células da linha do meio consistem nas células bo- 
ard[1][0], board] I ][ 1], board[ 1 [2]. Neste caso, definiu-se que as células do arranjo board seriam 
inteiros, com um O indicando uma célula vazia, um | indicando um X e um -1 indicando O, Esta 
codificação permite uma maneira simples de testar se uma dada configuração de tabuleiro é ven- 
cedora para X ou O apenas testando se os valores de uma linha, coluna ou diagonal somam 3 ou 
—3. Demonstra-se esta abordagem na Figura 3.8. 


х MEE 
|o af of KK 
tabuleiro do jogo aranjo do tabuleiro 


Figura 3.8 Demonstração do tabuleiro de jogo da velha e do arranjo de inteiros bidimensional 
que representa o mesmo. 


Apresenta-se uma classe Java completa para manter um tabuleiro de jogo da velha para dois 
jogadores nos Trechos de código 3.10 e 3.11. Apresenta-se um exemplo de saída na Figura 3.9. 
Observa-se que este código serve apenas para manter o tabuleiro do jogo e registrar os mowi- 
mentos; ele não executa nenhuma estratégia nem permite que se jogue contra o computador. Tal 
programa seria um bom projeto em uma aula de inteligência artificial. 


/** Simulação do jogo da velha (não tem estratégia) */ 
public class TicTacToe { 
protected static final int X = 1,0 = —1;  //jogadores 
protected static final int EMPTY - 0; // célula vazia 


116 Estruturas de Dados e Algoritmos em Java 


protected int board[ ]| ] = new int[3][3]; // tabuleiro 
protected int player; H jogador corrente 
/** Construtor */ 
public TicTacToe( } ( clearBoard(); } 
;/** Limpa o tabuleiro *f 
public void clearBoard( ) { 
for (inti = 0; |< 3; be) 
for (int | = 0; j = 3: je] 
Бага [| = EMPTY; // toda a célula deve estar vazia 
player = X; ¿Po primeiro jogador 4 
} 
Fr Coloca um X ou O na posição і */ 
public void puthMark(int i, int || throws illegal&rgumentException 1 
wiücollai-22gso01i/j-2) 
throw new IllegalArgumentException(" Invalid board position") 
if (board[i][j] ls EMPTY) 
throw new lllegalArgumentExceptionl" Board position occupied”) 
boardi] = player; i insere a marca do jogador corrente 
player = — player: ft troca os jogadores (usa o fato de que O = -X) 
} 
/** Verifica se a configuração do tabuleiro ё vencedora para algum jogador */ 
public boolean isWinlint mark) | 
return ((board[O][D] + board[O][1] + board[0][2] == mark*3) // linha O 
| | (board[1][0] + board[1][1] + board[1)[2] == mark*3) 4 linha 1 
| | íboard[2]10] + board[2)[1] + board[2][2] == mark*3) // linha 2 
| | (board[0)/0] + board[1][0] + board[2][0] == mark*3) // coluna O 
| | (board[0][1] + board[1][1] + board[2][1] == mark*3) // coluna 1 
| | (board[0][2] + board[1][2] + board[2][2] == mark*3) // coluna 2 
| | iboard[0]10] + board[1][1] + board[2][2] == mark*3) // diagonal 
| |iboard[2]/0] + board[1][1] + board[0][2] == mark*3); // diagonal 
} 
¿2 Retorna o jogador vencedor ou indica um empate */ 
public int winner) { 
if (ise Win(X) 
return‘); 
else if {isini 
returni 
else 
returno); 
| 


Trecho de código 3.10 Uma classe Java simples e completa para jogar jogo da velha entre dois 
Jogadores (continua no Trecho de código 3,11) 


/** Retoma uma string de caracteres que representa o tabuleiro corrente */ 
public String taStringt ) { 
Strings ="":; 
for (int i20; i3; 1+ +) f 
for (int j=D; |-23; ++)! 
switch (board[il[iT) 1 
case Nis += "X": break; 
case O: s += "o"; break; 
case EMPTY; s +=" "break; 
| 
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М = 2) 6 +=" |=; ¿limite da coluna 
) 
if fi < 2) 8 += "meen: i limita da linha 
і 
return 5; 


} 

#** Testa a execução de um jogo simples 

public static void main(String[ | args! { 
TicTacToe game = new TicTacToel |; 


/* Jogada de X */ ;* Jogada de O */ 
garne.putMark(1, 1); game .putMark(0,2); 
game.putMarkl? 2): game.putMark0,0%; 
game, putMark(0, 1); game, putMarkt2 1); 
game. риёїмаг 1 „25; game.putMark( 0}: 
game.putiMark(2,0); 


System.out.printimgame.toStringl Jl 
int winningPlayer = game winner? y; 
if (winningPlayer (= 0) 
System. out printintwinningPlayer +" wins" 
else 
System.out.println(" Tie"); 
} 
| 


Trecho de código 3.11 Uma classe Java simples e completa para jogar o jogo da velha entre 
dois jogadores (continuação do Trecho de código 3.10). 


о|х|о 


a|x|x 
x|o|X 
Tie 


Figura 3.9 Exemplo de saída do jogo da velha. 


3.2 Listas simplesmente encadeadas 


Na seção anterior, foi apresentada a estrutura de dados arranjo, e discutiram-se algumas de suas apli- 
cações. Arranjos são interessantes e simples para armazenar coisas em uma certa ordem, mas têm o 
problema de não serem muito adaptáveis, uma vez que deve-se prever o tamanho № do arranjo. 

Existem, entretanto, outras maneiras de armazenar uma seqüéncia de elementos que não têm 
este problema. Nesta seção, será explorada uma importante alternativa de implementação conhe- 
cida como lista simplesmente encadeada. 

Uma lista encadeada, em sua forma mais simples, é uma coleção de nodos que juntos for- 
mam uma ordem linear. A ordem é determinada como no jogo de criança “siga o chefe”. no qual 
cada nodo é um objeto que armazena uma referência para um elemento e uma referência, chama- 
da next, para outro nodo (ver a Figura 3.10). 

Pode parecer estranho que um nodo tenha uma referéncia para outro nodo, mas este esquema 
funciona facilmente. A referência next dentro de um nodo pode ser vista como uma ligação ou 
um ponteiro para outro nodo. Da mesma forma, a movimentação de um nodo para outro seguin- 
do a referência next é conhecida como salto pela ligação ou salto pelo ponteiro. O primeiro e 
o último nodos de uma lista encadeada são normalmente chamados de cabeça (head) е cauda 
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[ux | ej MSP] +) —» ATL | Heos] jm 
cabega cauda 


Figura 3.10 Exemplo de uma lista simplesmente encadeada cujos elementos são strings indi- 
cando códigos de aeroportos. Os ponteiros next de cada nodo são representados como setas. O 
objeto null é denotado como £2, 


(rif da lista, respectivamente. Assim, pode-se saltar pelas ligações da lista iniciando na cabeça 
e terminando na cauda. identifica-se cauda por ser о nodo que possui uma referência next nula, à 
que indica o fim da lista. Uma lista encadeada definida desta forma é conhecida como uma lista 
simplesmente encadeada. 

Da mesma forma que um arranjo, uma lista simplesmente encadeada mantém seus elemen- 
tos em uma certa ordem. Esta ordem é determinada pela cadeia de ligações next que parte de um 
nodo para seu sucessor па lista. Ao contrário de um arranjo, uma lista encadeada não tem um ta- 
manho fixo predeterminado e usa um espaço proporcional à quantidade de seus elementos. Além 
disso, os nodos de uma lista encadeada não são indexados. Assim, apenas examinando um nodo 
individual, não é possivel dizer se ele é o segundo, quinto ou o vigésimo da lista, 


implementando uma lista simplesmente encadeada 


Para implementar uma lista simplesmente encadeada, define-se uma classe Node, como mostrado 
по Trecho de código 3.12, a qual especifica o tipo dos objetos que serão armazenados nos nodos da 
lista. Aqui, se assume que os elementos são strings. No Capítulo 5, se descreve como definir nodos 
que podem armazenar tipos arbitrários de elementos. Definida a classe Node, pode-se definir a 
classe SLinkedList, apresentada no Trecho de código 3.13, definindo a lista encadeada real. Esta 
classe mantém a referência para o nodo cabeça e uma vartável que conta o número total de nodos, 


PR Nodo de uma lista simplesmente encadeada de strings */ 
public class Mode f 
private String element; “/ assumimos que os elementos são strings 
private Node next; 
/** Cria um nodo com um dado elamento e o próximo nodo */ 
public Node(String s, Node п) { 
element = 5; 
next = n; 
] 
/** Retorna o elemento deste nodo */ 
public String getElement ) { return element; ) 
/** Retorna o próximo elemento deste nodo */ 
public Mode getNext ) [ return next; ) 
// Métodos modificadores: 
/** Define o elemento deste nodo */ 
public void setElamentiString newElem) ( element = newElem; } 
/** Define o próximo elemento deste nodo */ 
public void sethHextMNode new Next) | next = newMaxt; } 


Trecho de código 3.12 Implementação de um nodo de uma lista simplesmente encadeada, 


/** Lista simplesmente encadeada */ 
public class SLinkedList [ 
protected Node head; — //nodo cabeça da lista 
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protected long size; ¿número de nodos da lista 
/** Construtor default que cria uma lista vazia */ 
public SLinkedList( ) | 
head = null; 
size = 0; 
| 
No... 06 métodos de pesquisa e atualização vão aqui... 


) 
Trecho de código 3.13 Implementação parcial da classe de uma lista simplesmente encadeada. 


3.2.1 inserção em uma lista simplesmente encadeada 


Quando se usa uma lista simplesmente encadeada, pode-se facilmente inserir um elemento na 
cabeça da lista, como pode ser visto na Figura 3.11 e no Trecho de código 3,14, A idéia principal 
é que se cria um nodo novo, define-se sua ligação next para referir o mesmo objeto que head е, 
então, define-se head para apontar рага o novo nodo, 


cabeça 


LAX | ei----» MSP | «-— —» ATL | = BOS | — (7j 
M a Lo. 1 | L + ] L | J 


(Б) 


LAX | «e e MSP | e= = ATL = > BOS *- (2) 


Figura 3.11 Inserção de um elemento na cabeça de uma lista simplesmente encadeada: (а) 
antes da inserção; (b) criação do novo nodo; (c) depois da inserção. 


Algoritmo addFirst(v) 


v.SetNext(head) | faz v apontar para o nodo cabeça antigo | 
head «— v | faz a variável head apontar para o nodo novo | 
size — size + | | incrementa o nodo contador | 


Trecho de código 3.14 Inserção de um nodo novo v no início de uma lista simplesmente 
encadeada. Observa-se que este método funciona mesmo que a lista esteja vazia. Observa-se 
também que se definiu o ponteiro next do novo nodo v antes de fazer a variável head apontar 
para v. 
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inserindo um elemento na cauda de uma lista simplesmente encadeda 


Pode-se inserir um elemento na cauda de uma lista simplesmente encadeada com facilidade des- 
de que se mantenha uma referência para o nodo cauda, como mostrado na Figura 3.12, Neste 
caso, cria-se um nodo novo, atribui-se null para sua referência next, faz-se com que a referência 
next do nodo cauda aponte para este novo objeto, e que a referência para a cauda propriamente 
dita, tail, aponte para o nodo novo. Os detalhes aparecem no Trecho de código 3,15, 


cauda 


MSP | em ® ATL es » BOS € = (2) 


(a) 

cauda 

4 = 
MSP | es ATL | + ВОЗ | e (7j МА ew C 
(hi 
Cauda 
=, | ET 
MSP! + > ATL | = > BOS « = MIA | a = (UU 

[c] 


Figura 3.12 Inserção na cauda de uma lista simplesmente encadeada: (a) antes da inserção, (b) 
criação do nodo novo: (c) depois da inserção, Observe que se define o valor da referência next de 
tail em (b), antes de fazer a variável tail apontar para o nodo novo em (c). 


Algoritmo addLastí v 


v.setNext(null) [faz com que o nodo novo, v, aponte para null) 
tail.setNextiv) [faz com que o nodo cauda antigo aponte para o nodo novo) 
tail «— v [faz a variável tail apontar para o nodo novo] 

size — size + | [incrementa o contador de nodos | 


Trecho de código 3.15 Inserção de um nodo novo no final de uma lista simplesmente en- 
cadeada. Este método também funciona se a lista está vazia, Observe que o valor do ponteiro 
next do nodo cauda antigo é alterado antes que de se fazer a variável tail apontar para o nodo 
novo. 


3.2. Removendo um elemento em uma lista simplesmente encadeada 


А operação inversa da inserção de um novo elemento na cabeça de uma lista encadeada é a remo- 
ção de um elemento da cabeça da lista. Esta operação é demonstrada na Figura 3.13 e detalhada 
no Trecho de código 3.16. 
Algoritmo removeFirstí |: 


se head = null então 
Indica um erro: a lista está vazia. 
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cabeça (a) 
A, | i 
АХ ж = MSP e+ = ATL « | BOS | *- > 
cabeça (b) 
4 


МӘР | = e ATL |^ us = BOS + = (72) 
(ej 


Figura 3.13 Remoção de um elemento da cabeça de uma lista simplesmente encadeada: (a) 
antes da remoção; (b) “desconectando” o antigo nodo novo; (c) após a remoção. 


1 = head 

head +- head.gotHexk | [faz head apontar para o próximo nodo (ou null) | 
t.sathextinullj [atribui null para o ponteiro next do nodo removido | 

size = size — I [decrementa o contador de nodos] 


Trecho de código 3.16 Removendo um nodo no início de uma lista simplesmente enca- 
deada. 


Infelizmente, não é possível deletar o nodo da cauda da lista com a mesma facilidade, Mes- 
mo se houver uma referência diretamente para o último nodo da lista, É necessário acessar o 
nodo antes do último para conseguir remové-lo. Mas não se pode atingir o nodo antes da cauda 
seguindo as conexões a partir da cauda. À única maneira de acessar este nodo é iniciar a partir da 
cabeça da lista pesquisando ao longo da mesma. Mas a sequência de saltos pelas ligações pode 
consumir um tempo considerável. 


3.3 Listas duplamente encadeadas 


Como visto na última seção, remover um elemento da cauda de uma lista simplesmente enca- 
deada não é fácil. Na verdade, consome muito tempo remover qualquer nodo, exceto a cabeça 
em uma lista simplesmente encadeada, uma vez que não existe uma forma rápida de acessar о 
nodo na frente daquele que se quer remover, Na verdade, existem várias aplicações nas quais é 
necessário acessar rapidamente o nodo predecessor. Рага tais aplicações, € interessante ter uma 
maneira de se mover em ambas as direções em uma lista encadeada, 

Existe um tipo de lista encadeada que permite o deslocamento em ambas as direções — para 
frente e para trás — em uma lista encadeada, Е uma lista duplamente encadeada, Tais listas per- 
mitem uma grande variedade de operações rápidas de atualização, incluindo inserções e remo- 
ções em ambas extremidades e no meio. Um nodo em uma lista duplamente encadeada armazena 
duas referências — uma ligação next, que aponta para o próximo nodo da lista, e uma ligação 
prev, que aponta para e nodo anterior. 
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O Trecho de código 3.17 apresenta uma implementação Java de um nodo de uma lista du- 
plamente encadeada na qual se assume que os elementos são strings. No Capitulo 5, discute-se 
como definir nodos para tipos arbitrários de elementos. 


F** Modo de uma lista duplamente encadeada de strings */ 
public class DNode [ 
protected String element; // String armazenada pelo nado 
protected DNode next, prev; // Ponteiros para о nodo seguinte e o anterior 
/** Construtor que cria um nodo com os campos fornecidos */ 
public DNode(String e, DMode p, ОМоде n) [ 


element = е; 
prev = р, 
next = n, 


i; 


/** Retorna o elemento deste nodo */ 

public String getElement() { return element; ) 

/** Retoma o nodo anterior a este */ 

public DNode дегем) { return prev; } 

/** Retorna o nodo seguinte a este */ 

public DMode getHext( ) { return next; | 

/** Atribui o elemento deste nodo */ 

public void setElament(String newElem) [ element = newElem; ] 
/** Atribui o nodo anterior deste nodo */ 

public void setPreviDMode newPrev) { prev = newPrev; | 
/** Atribui o nodo seguinte a este nodo * 

public void setaext(DNode newhlext) next = newblext; | 


) 


Trecho de código 3.17 Classe Java DNode representando um nodo de uma lista duplamente 
encadeada que armazena uma string. 


Sentinelas da cabeca e da cauda 


Para simplificar a programação, é conveniente acrescentar nodos especiais em ambas as extremi- 
dades de uma lista duplamente encadeada: um nodo cabeçalho (header) antes da cabeça da lista 
e um nodo final (trailer) após а cauda da lista. Estes nodos "falsos" ou sentinelas não armaze- 
nam nenhum elemento. O cabeçalho tem uma referência next válida e uma referência prev nula, 
enquanto que o final tem uma referência prev válida e uma referência next nula. Uma lista dupla- 
mente encadeada com estas sentinelas é apresentada na Figura 3,14, Observa-se que o objeto lista 
encadeada terá simplesmente de armazenar referências para estas duas sentinelas e um contador 
size para manter o número de elementos na lista (sem contar os sentinelas). 


aer next == next | пехї ЖЫ next taller 
prev prev TT prev prev 


Figura 3.14 Uma lista duplamente encadeada com sentinelas, header e trailer, marcando as 
extremidades da lista. Uma lista vazia terá estas sentinelas apontando uma para outra. Não se 
desenha o ponteiro prev nula do header nem o ponteiro next nulo do final. 


Inserir ou remover elementos em qualquer extremidade de uma lista duplamente encadeada 
é fácil de fazer. Na verdade, a ligação prev elimina a necessidade de percorrer a lista para obter 
o nodo que antecede a cauda. À Figura 3.15 mostra a remoção na cauda de uma lista duplamente 
encadeada е os detalhes desta operação no Trecho de código 3. 18. 
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header | | їгайег 
ek lem [COSS [n а» [no COS Ero AO | 
(a) 
header й | | m ^. trailer 
[RM [em [CR рө [sol A] 
(hi a td 
header trailer 
> ANETTE AA 
(c) 


Figura 3.15 Remoção de um nodo na extremidade de uma lista duplamente encadeada com 
sentinelas para o cabeçalho e o final: (a) antes de deletar a cauda; (b) deletando a cauda; (c) após 
a deleção. 


Algoritmo removeLast[ |: 
se size = О епійо 
Indica um erro: a lista está varia 


v trailer getPrev( | [último modo | 

и + v,getPrew ) { nodo antes do último nodo | 
traer setPrew() 

u. setNextitrailer) 

v.setPrevinull) 


v,setNextinull] 
size = size — 1 


Trecho de código 3.18 Remoção do último nodo de uma lista duplamente encadeada, A va- 
nável size mantém a quantidade de elementos na lista. Observa-se que este método também 
funciona se a lista tiver tamanho 1. 


Com à mesma facilidade pode-se inserir um novo elemento no inicio de uma lista simples- 
mente encadeada, como pode ser visto na Figura 3.16 e no Trecho de código 3.19. 


Algoritmo addFirst(w): 
w є header.getNext( ) (primeiro nodo) 
v.setNext(w) 
v, SetPrev(header) 
w.setPrev(v) 
header. setNaext(i) 
size = size + 1 


Trecho de código 3.19 Inserção de um nodo novo v no início de uma lista duplamente enca- 
deada. A variável size mantém a quantidade de elementos na lista. Observa-se que este método 
também trabalha sobre uma lista vazia. 


3.3.1 — Inserção no meio de uma lista duplamente encadeada 


Listas duplamente encadeadas são úteis para mais do que inserir e remover elementos no 
início e no fim da lista. Elas também são convenientes para manter uma lista de elementos e 


T trailer 
[e Cte [n Т9 Ро Ji” 
E SE | 

| BWI e 

men i (a) 


header trailer 

| =, Р T -—- T l'L—APT т] ГГ Tema [7 
A e | 

Le Гам [oe JE SITES [вго |е е | 


I ut SN sene 


(h) 


Figura 3.16 — Acrescentando um elemento no inicio: (a) durante: (bj depois. 


permitir inserções no meto da lista. Dado um nodo v de uma lista duplamente encadeada (que 
até pode ser o nodo cabeça, mas não a cauda), pode-se facilmente inserir um novo nodo z ime- 
diatamente após v. Mais especificamente, considere w como o nodo que segue v, Executam-se 
os seguintes passos; 

. faga a ligação prev de z se referir a v 

. faga a ligação next de z se referir a w 

. faça a ligação prev de w se referir a z 

faça a ligação next de v se referir a z 


E w H = 


Este método é apresentado em detalhes no Trecho de código 3.20 e é demonstrado na Figura 
3,17, Lembrando do uso das sentinelas cabeçalho e final, observe que este algoritmo funciona 
mesmo que v seja o nodo cauda (o nodo que antecede o final). 


Algoritmo addAfter( v. 


we y,getMext | (nodo que segue v] 

z.setPreviv) [conecta z a seu predecessor, v] 
z.getMext(u) [conecta z а seu sucessor, w] 
w.setPrev[7) [conecta w a seu novo predecessor, 2] 
v.setNexti(z) [conecta v a seu novo sucessor, z] 


Size —— size + 1 


Trecho de código 3.20 Inserção de um novo nodo z depois de um nodo y em uma lista dupla- 
mente encadeada, 


header trailer 
ROSE TC ROO 
вул ү 
[a] 
header trailer 
| 2 | к K- *. ES Lu PVD Lu A. | SFO Th | 
(hi 


Figura 3.17 — Acrescentando um nodo novo depois do nodo que armazena JFK: (a) criando um 
nodo novo com o elemento BWI e conectando o mesmo; (b) depois da inserção. 
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3.3.2 Remoção do meio de uma lista duplamente encadeada 


Da mesma forma, é fácil remover um nodo v do meio de uma lista duplamente encadeada. Acessam- 
se os nodos u é w em ambos os lados de v usando os métodos getPrev с getNext de v (estes nodos 
devem existir uma vez que se está usando sentinelas). Para remover o nodo v, basta fazer 4 e w apon- 
tarem um para o outro em vez de apontarem para v. Esta operação é conhecida como desconexão de 
v. Atribui-se nulo para os ponteiros next e prev de v de maneira а não manter referências antigas para 
à lista, O algoritmo é apresentado no Trecho de código 3.21 e ilustrado na Figura 3.18. 


Algoritmo 3.18: removelr): 


и v,getPrev i) { nodo antes de à] 

w «— v.getMext () [nodo depois de v] 

w setPrewiu) [desconectando v] 

u.setNext(w) 

v.setPrev(null) [anulando os campos de v] 

v setNextinull) 

size «— sire — | [decrementando o contador de nodos | 


Trecho de código 3.21 Remoção do nodo v de uma lista duplamente encadeada. Este método 
funciona mesmo que v seja o primeiro, o último ou um nodo näo-sentinela. 


header trailer 
Kie ELS ICS LIC 2EZIL e | 


(a) 


header traller 
келее Дю 
(b) 
header trailler 
ем е 6 SIE | AO | 
ic) 


Figura 3.18 Removendo o nodo que armazena POW: (a) antes da remoção; (b) desconectando 
o nodo antigo: (c) depois da remoção (coleta de lixo). 


3.3.3 Implementação de uma lista duplamente encadeada 


Nos Trechos de código 3.22-3,.24, apresenta-se a implementação de uma lista duplamente enca- 
deada com nodos que armazenam strings. 


/** Lista duplamente encadeada com nodos do tipo DNode que armazenam strings */ 
public class DList { 

protected int size; “quantidade de elementos 

protected DMode header, trailer, 4 sentinelas 

** Construtor que спа uma lista vazia */ 

public DListí ) [ 
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size = D; 
header = new DNode(null, null, null); // cria o cabeçalho 
trailer = new DNeode(null, header, null; // спа o final 
header. setNextitrailer); // faz o cabeçalho e o final apontarem um para o outro 
] 
/** Retorna o número de elementos na lista */ 
public int size( | { return size; | 
/** Informa se a lista está vazia */ 
public boolean isEmptyt ) return (size == 0); } 
/** Retorna o primeiro nodo da lista */ 
public DMode getFirst( ) throws lllegalStateException { 
if (isEmpty()) throw new lllegalStateException("List is empty") 
return header.getMexti |; 
} 
/** Retorna o último nodo da lista */ 
public DNode де а= ) throws IllagalStateException 


if isEmpty( jj throw new lllegalStateException(^List is empty") 
return trailer.getPrevi |; 
| 
/** Retorna o nodo que antecede um dado nodo v. Gera erro se v é o cabeçalho */ 
public DMode getPreviDMNode v) throws lllegal&rgumentException { 
if (v == header) throw new illegal&rgumentExcaption 
("Cannot move back past the header of che list") 
return v.getPrevi |; 
) 
/** Retorna o nodo que segue um dado nodo v. Gera erro se v é o final */ 
public DNode getNext(DMode v) throws IllagalArgumentException | 
if (v == trailer) throw new lllegalárgumentException 
("Cannot move forward past the trailer of the list") 
return v.getNext(): 


| 


Trecho de código 3.22 Classe Java DList que implementa uma lista duplamente encadeada 
cujos nodos são objetos da classe DNode (ver Trecho de código 3.17) que armazenam strings 
(continua no Trecho de código 3.23). 


PR Insere um dado nodo = antes de um dado nodo v. Gera um erro se v é o cabeçalho */ 
public void addBetore(DMode v, DMode z) throws IlegalärgumentException [ 
DMode и = getPrevivi; // Deve lançar uma Illagal&rgumentException 
z.setPrev(uk 
z setMext(v); 
v.setPreviz): 
u.setNext(z) 
Size++! 
} 
/** insere um dado подо z depois de uma dado nodo v. Gera um erro se v é o final */ 
public void addAfter(DNode v, DNode 2) { 
DNode w = getNextív) N Deve lançar uma lllegal&rgumentException 
z setPrev(v); 
z.setMext(wy 
w.SsetPreviz!: 
v.setMaext(z): 
SIEB++, 
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| 


/** insere o nodo fornecido na inicio da lista */ 
public void addFirst(DNode v) { 
addAfter(header, v); 


/** |nsere o nodo fornecido no fim da lista */ 
public void addLastDNode v) { 
addBetore(trailer, v); 


/** Remove um dado nodo v da lista. Gera um erro se v é o cabecalho ou a final */ 
public void remove(DNode v) { 

DNode u = getPrev(v): і! Deve lançar uma \llegalärgumentException 

DMode w = getMextiv; — // Deve lançar uma Illegal&rgumentException 

// Desconecta o nodo da lista 

w.setPrewiu); 

u.setMext(wyk 

v.selPrevinull); 

+ sethextimil; 

siza ——; 


i 


Trecho de código 3.23 Classe Java DList que implementa uma lista duplamente encadeada 
(continua no Trecho de código 3,24). 


/** Indica se o nodo indicado possui um antecessor */ 
public boolean hasPrev(DNode v) [ return v !— header, } 
/** Indica se o nodo indicado possui um sucessor */ 
public boolean hasMext(DMode v) { return v !— trailer; } 
/** Retorna uma representação string da lista */ 
public String toString( ) 4 
Strings = "["; 
DNode v = header getNext; 
while (v != trailer) { 
& += v.getElement[ |: 
v = v. getNexti |; 
if {v "= trailer) 
+="; 
} 
+=” | = 
return 5; 
1 
} 


Trecho de código 3.24 Classe de uma lista duplamente encadeada (continuação do Trecho de 
código 3.23). 


Podem-se fazer as seguintes observações a cerca da classe ГИ ist. 


+ Objetos da classe DNode, que armazenam elementos string, são usados para todos os 
nodos da lista, incluindo os sentinelas cabeçalho e final. 

+ A classe DList pode ser usada apenas para uma lista duplamente encadeada de strings. 
Para construir uma lista encadeada para outros tipos de objetos, é necessário usar uma 
declaração genérica que será discutida no capitulo 5. 

* Os métodos getFirst e getLast provêm acesso direto ao primeiro e último nodos da lista. 

+ Os métodos getPrev e getNext permitem percorrer a lista. 
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Os métodos getPrev e getNext detectam os limites da lista. 

Os métodos addFirst e addLast acrescentam nodos no início e no fim da lista, 

Os métodos addBefore e addAfter acrescentam um nodo novo antes ou depois de um 
nodo existente, 

e A existência de um único método de remoção. remove, não chega a ser uma restrição 
uma vez que é possível remover do inicio ou do fim de uma lista encadeada L executando 
L.remove(L.getFirst jj ou Lrernoveil.getLast( ). respectivamente. 

+ D método toString que converte a lista inteira em uma string é útil para propósitos de 
depuração e teste. 


3.4 Listas encadeadas circulares e ordenação de 


listas encadeadas 


Nesta seção, serão estudadas algumas aplicações e extensões de listas encadeadas. 


3.4.1 


t N. de T. Em inglés, "Duck, Buck, Goose" 


Listas encadeadas circulares e a brincadeira do "Pato, Pato, Ganso" 


A brincadeira de criança “Pato, Pato, Ganso"* existe em muitas culturas. As crianças de Minne- 
sea praticam uma versão chamada "Duck, Duck, Grey Duck"**. mas não perguntem o porque. 
Em Indiana, este jogo é chamado "The Mosh Pot”, As crianças da República Checa e de Gana jo- 
gam versões cantadas do jogo, conhecidas, respectivamente, como “Pesek” e "Antoakyire". Uma 
variação das listas encadeadas, chamada de lista encadeada circular, é usada em várias aplicações 
que envolvem jogos de roda tais como “Pato, Pato, Ganso”. Este tipo de lista e as aplicações dos 
jogos de roda serão analisados a seguir, 

Uma lista encadeada circular tem o mesmo tipo de nodos que uma lista encadeada simples. 
Isto é, cada nodo em uma lista encadeada circular tem um ponteiro para o próximo nodo e uma 
referência para um elemento. Entretanto, não existe cabeça ou cauda em uma lista circular. Em 
ver do último nodo de uma lista circular apontar para null, ele aponta para o primeiro nodo, As- 
sim, não existe nodo inicial ou final. Se forem percorndos os nodos de uma lista circular à partir 
de qualquer nodo seguindo os ponteiros next, serão percorridos todos os nodos, 

Mesmo que uma lista circular não tenha início ou fim, sempre será necessário que algum nodo 
seja marcado de forma especial, sendo chamado de cursor. O nodo cursor serve como ponto de 
partida sempre que for necessário percorrer a lista circular. E se for possível lembrar do ponto de 
partida, então é possível saber quando se completou a volta — o caminhamento sobre uma lista enca- 
deda circular está completo quando se retorna ao nodo marcado como cursor quando se começos. 

Pode-se definir alguns métodos de atualização simples para uma lista encadeada circular; 

азат: Insere um nodo novo, v, Imediatamente após o cursor; se a lista está va- 
zia, então v torna-se o cursor e seu ponteiro next aponta para si mesmo, 


remove remove e retoma o nodo s que e encontra imediatamente após D CUISOT 
(nào à cursor propriamente dito a menos que ele seja o único nodo); se 
a lista hear vazia. o cursor é definido como null. 


advance(k avança o cursor para o próximo nodo da lista, 


++ N de T. “Pato, Pato, Pato Cinza, 
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No Trecho de código 3.25, apresenta-se uma implementação Java para a lista encadeada cir- 
cular que usa a classe Nodo do Trecho de código 3.12 e inclui um método toString para produzir 
uma representação da lista. 


feb Lista encadeada circular com nodos do tipo Node que armazenam strings */ 
public class CircleList ( 
protected Node cursor; ¿Co cursor corrente 
protected int size; ¿a quantidade de nodos da lista 
/** Construtor que cria uma lista vazia */ 
public CircleList() { cursor = null; size = 0; } 
/** Retorna o tamanho corrente */ 
public int size) { return size; } 
/** Retorna o cursor */ 
public Node getCursor( ) return cursor; ) 
/** Move o cursor adiante */ 
public void advance) | cursor = cursor.geiMextl); | 
/** Acrescenta um nodo depois do cursor */ 
public void addíNode newNode) { 
if (cursor == null) | ¿Mist is empty 
newbMode.setHextinewMNode]; 
cursor = newllode, 
} 
else | 
newhNode.setMext(cursor.getNext()); 
cursor. setHNextinewNodea): 
i 
SIZ8 44: 
} 
/** Remove o nodo que segue o cursor */ 
public Node removal } ( 
Node oldNode = cursor.getMexti |; // o nodo sendo removido 
fioldNode == cursor) 
cursor = null; // a lista se torna vazia 
else { 
cursor. setNextoldNode, getNext |); H desconecta o nodo antigo 
oldNode.setHNextinull); 
) П 
size ——: 
return oldNode; 
| 
r** Retorna uma representação string da lista, iniciando pelo cursor */ 
public String toString ) { 
if (cursor == null) return " [ 1"; 
String&- 71..." + cursorgetElement( y; 
Made oldCursor = cursor; 
for (advance |; oldCursor |= cursor, advancel |) 
5+=", "+ Cursor.getElement( |; 
return s+"...]”, 


Trecho de código 3,25 Uma lista encadeada circular com nodos simples. 
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Algumas observações sobre a classe CircleList 


Existem algumas observações que podem ser feitas a respeito da classe CircleList. É um programa 
simples que pode fornecer enorme funcionalidade para simular jogos de roda tais como "Pato, 
Pato, Ganso”, como será visto. Deve-se observar, entretanto, que não é um programa robusto. 
Em especial, se a lista circular está vazia, então chamar advance ou remove sobre a lista irá gerar 
uma exceção. (Qual?) O exercício R-3.5 lida com este comportamento gerador de exceção e com 
maneiras de lidar melhor com esta condição de lista vazia, 


Pato, Pato, Ganso 


No jogo de "Pato, Pato, Ganso”, um grupo de crianças senta em circulo. Uma delas é eleita para 
ser o “pegador e caminhar por fora do circulo. O pegador bate na cabeça de cada criança dizen- 
do “pato” até que identifica uma delas como sendo “ganso”. Neste ponto, gera-se uma confusão 
com o “ganso” e o pegador correndo ao redor do círculo. Quem retornar ao lugar do “ganso” 
primeiro, permanece no círculo. O perdedor da corrida será o pegador na próxima rodada. O jogo 
continua assim até que as crianças se aborregam ou um adulto diga que acabou o tempo (ver a 
Figura 3,19). 


(a) (bi 


Figura 3.19 O jogo "Pato, Pato, Ganso”: (a) selecionando o “ganso”; (b) corrida para o lugar 
do “ganso” entre o “ganso” e o pegador. 


A simulação deste jogo é uma aplicação ideal para listas encadeadas circulares. Às crianças 
podem representar os nodos da lista. O pegador pode ser identificado como a pessoa sentada após 
o cursor, e pode ser removida da lista para simular a marcha ao redor. Avanga-se o cursor para cada 
“pato” que o pegador identifica, o que pode ser simulado com uma decisão aleatória. Uma vez 
que um “ganso” é identificado, pode-se remover este nodo da lista, fazer um sorteio aleatório para 
decidir quem irá ganhar a comida e Inserir o vencedor de volta na lista. Então, avança-se o cursor e 
insere-se o pegador de volta, repetindo o processo (ou encerra-se, sc esta foi a última rodada). 


Usando uma lista encadeada circular para simular o Pato, Pato, Ganso 
O Trecho de código 3.26 apresenta o código Java que simula o jogo do Pato, Pato, Ganso, 


{= Simulação do Pato, Pato, Ganso usando uma lista encadeada circular */ 
public static void main(Stringl | args) | 

CircleList C = new CircleList( |: 

intN=3; "Quantidade de iterações do jogo 

Made it; i jogador que е o “pegador” 

Mode goose; // ganso 

Random rand = new Random; 


Arranjos, Listas Encadeadas e Recursáo 131 


rand.setSeed(System.currentTimeMIillis()); // usa o tempo corrente como semente 
// Os jogadores 
Siring ] names = (" Bob", " Jen", "Pam" "Tom", "Ren", "Vic", "Sue", "Joe"; 
for (int | = 0; 1< names length; ++) { 

C.add(new Node(nameas(i], nul 


C.advance |; 

| 

for (inti = 0; i -€ N; +) { ff joga pato, pato, ganso N vezes 
System.out.printin("Playing Duck, Duck, Goose for * «C.toString() 
it = C.remove( ); 


System out printindt.getElement() +" is ic.*); 
while (rand.nextBoolean( ) | | rand.nextBoolean( |) { // anda ao redor do circulo 
C.advance( |: // avança com probabilidade de 34 
System.out.println(C.getCursor(.getElement() + " is a duck." 
} 
goose = C.removel |; 
System,out,printinigoose.getElement() + " is the goose!"); 
if rand.nexiBooleani }) { 
System.out.println(*The goose won!) 
C.add(goose);  coloca o ganso de volta no seu lugar antigo 
C.advance(); // agora о cursor ё o ganso 
C.addíit); // © pagador será o mesmo na próxima rodada 
| 
else | 
System.out.printin(*The goose lost!" 
C.addit); // coloca o pegador no lugar do ganso 
C.advancel ); // agora O cursor está no pegador 
C.add(goose); // о ganso será o pegador na próxima rodada 
| 


} 
System.out.printin("Final circle is " + CtoString)); 


Trecho de código 3.26 Método principal de uma programa que usa uma lista encadeada circu- 
lar para simular o jogo de criança Pato, Pato, Ganso. 


Um exemplo de saída 


A Figura 3.20 mostra um exemplo de saída resultante de uma execução do programa do Pato, 
Pato, Ganso. 

Observa-se que cada iteração nesta execução particular do programa produz um resultado 
diferente, em virtude das configurações iniciais diferentes e do uso de escolhas aleatórias para 
identificar os patos e gansos, Da mesma forma, se o “pato” ou o “ganso” ganha a corrida tambén 
varia, dependendo de escolhas aleatórias. Esta execução mostra uma situacáo em que a próxima 
criança após o pegador é imediatamente identificada como “ganso”, bem como uma outra em 
que o pegador caminha ao redor de todo o grupo de crianças antes de identificar o “ganso”. Tais 
situações demonstram a utilidade de uma lista encadeada circular na simulação de jogos de roda 
tais como o Pato, Pato, Ganso. 


3.4.2 — Ordenando uma lista encadeada 


No Trecho de código 3.27, é apresentado o algoritmo inserção ordenada (Seção 3.1.2) para uma 
lista duplamente encadeada. Uma implementação Java é apresentada no Trecho de código 3.28. 
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Playing Duck, Duck, Goose for [...Joe, Bob, Jen, Pam, Tom, Ron, Vic, Sue...] 
Bob is it. 

Jen is a duck. 

Pam is a duck. 

Tom is a duck. 

Ran is the goose! 

The goose won! 

Playing Duck, Duck, Goose for [...Ron, Bob, Vic, Sue, Joe, Jen, Pam, Tor...) 
Bob is it. 

Vic is the goosa! 

The goose won! 

Playing Duck, Duck, Goose for [...Vic, Bob, Sue, Joe, Jen, Pam, Tom, Ron...) 
Bab is it. 

Sue is a duck. 

Joe is a duck. 

Jen is a duck. 

Pam is a duck. 

Tom is a duck. 

Ron is a duck. 

Vic is a duck. 

Sue is the goose! 

The goose lost! 

Final circle is [...Bob, Sue, Joe, Jen, Pam, Tom, Ron, Vic...] 


Figura 3.20 Exemplo de saida do programa Pato, Pato, Ganso. 


Algoritmo InsertionSorti Lj: 
Entrada: uma lista duplamente encadeada £ com elementos comparáveis 
Saida: a lista L com os elementos reorganizados em ordem não decrescente 
Se L.siza() <= | então 
reburn 
end + L.getFirst( | 
enquanto end não for o último nodo de L faça 
pivot €— end.getMaxt y; 
Remove o pivat de L 
ins «— end 
enquanto ins nào for o cabeçalho e o elemento ¿ns for maior que o piver faça 
ins — ins getPrew ) 
Acrescenta o pivot após ins em L 
se ins = end então [recém adicionou-se o pivot após end, neste caso | 
end «— end.getNexti ) 


Trecho de código 3.27 Descrição em pseudocódigo de alto nível do algoritmo de inserção 
ordenada sobre uma lista duplamente encadeada. 


/** Inserção ordenada sobre uma lista duplamente encadeada da classe Dist */ 
public static void sort(DList Lj { 

se Lsizel ) == 1) retorne; // L ja está ordenado neste caso 

DNode pivot; if nodo pivô 

DNode ins; i ponto de inserção 

DNode end = L.getFirst( Y. // fim da execução 

enquanto (end != L.getLast( Y) 1 

plvat = end.getMext(Y J obtém o próximo nodo pivô 
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L.removeltpivot) // remove o mesmo 
ins z end; ff inicia a pesquisa pelo fim da ordenação 
while (L.hasPrev(ins) && 
ins.getElement( ).compareTo(pivot.getElement( | > 0) 

ins = ins.getPrew[) — //move para a esquerda 
L.addäfterfins,pivot; — // coloca o pivô de volta após o ponto de inserção 
if (ins == end) /! acrescenta o pivô no final, neste caso 

end = end.getMext(y; incrementa o indicador de fim 

| 


} 


Trecho de código 3.28 Implementação Java do algoritmo de inserção ordenada sobre uma lista 
duplamente encadeada representada pela classe DList (ver o Trecho de código 3.22-3.24). 


3.5 Recursáo 


Já foi visto que repetições podem ser obtidas escrevendo-se laços, tais como lagos for ou lagos 
while. Outra forma de se obter repetição é por melo da recursão, que ocorre quando uma função 
chama a si mesma. Já foram vistos exemplos de métodos que chamam outros métodos, de manei- 
га que não deve ser surpresa que a maioria das linguagens de programação modernas, incluindo 
Java, permite que um método chame a si mesmo. Nesta seção, será visto por que esta capacidade 
provê uma alternativa elegante e poderosa para executar tarefas repetitivas, 


A função fatorial 


Para demonstrar recursão, começa-se com um exemplo simples que computa o valor da função 
fatorial, O fatorial de um inteiro positivo n, denotado n!, € definido como sendo o produto dos 
inteiros de 1 até n, Se n = 0, então н! é definido como 1 por convenção. De uma maneira mais 
formal, para qualquer inteiro n = 0, 


at= l se n-ü 
© Im-in-1)n-2)-3-2.1 ве п>] 


Por exemplo, 5! = 5:4:3-2:] = 120. Para fazer a ligação com métodos mais clara, será usada а 
notação factorial(rm) para denotar n. 

A função fatorial pode ser definida de uma forma que sugere uma formulação recursiva. Para 
entender, observa-se que 


factorial(5) = 5-(4:3-2-1) = 5-factorial(4). 


Assim, pode-se definir factorial(ã) em termos de factorial(4), Normalmente, para um inteiro 
positivo n, pode-se definir factorial(a) como sendo m factorialin— 1). Isso leva a seguinte defini- 
ção recursiva. 


| se =} 
з | 
DOCE A) 5 SE SENSE se nzl 


Esta definição é típica de muitas definições recursivas. Primeiro, ela contém um ou mais 
casos base, que são definidos de forma não-recursiva em termos de quantidades fixas, Neste 
caso, n = 0 é ocaso base, Ela também contém um ou mais casos recursivos, que são definidos 
apelando para a definição da sua função. Observa-se que esta definição não é circular porque 
cada vez que a função é chamada seu argumento é diminuído de um. 
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implementação recursiva da função fatorial 


Considere-se a implementação Java da função fatorial apresentada no Trecho de código 3,20 sob 
o nome de recursiveFactorial( ). Observa-se que nenhum laço é necessário neste caso. As repeti- 
das invocações recursivas da função substituem o lago. 


public static int recursiveFactorial(int n) I tt função fatorial racursiva 
if (n == 0) return 1; // caso base 
else return n * recursiveFactorial(n = 1}: if caso recursivo 


| 


Trecho de código 3.29 Implementação recursiva da função fatorial. 


Pode-se ilustrar a execução da definição recursiva de uma função por meio de um rastrea- 
mento recursivo. Cada entrada do rastreamento corresponde a uma chamada recursiva, Cada 
nova chamada recursiva é indicada por uma seta apontando a nova função ativada, Quando a 
tunção retorna, uma seta indicando este retorno é desenhada, e o valor de retorno é indicado na 
mesma, À Figura 3.21 apresenta um exemplo de rastreamento. 

Qual é a vantagem do uso da recursão? Embora a implementação recursiva da função fatorial 
seja mais simples que a versão негата, neste caso não existe nenhuma razão determinante para 
se preferir a versão recursiva sobre a iterativa. Para alguns problemas, entretanto, a implementa- 
ção recursiva pode ser consideravel mente mais simples e mais fácil de entender do que a versão 
iterativa. Segue um exemplo destes. 


ratum 4'G = 24 ———— resposta final 


= 
ч, 
E: BN 
ч, 

Б 
ы 
retum I = 6 

A 
A 


N 


retum 2^1 = 2 
^ 


à 


№ 
М, 


retum 171 = 1 


chamada 


[ recursiveFactorial(4] 


recursiveFactorial3) 


i Chamada 


/ 


| recursiveFactorial(2) 
is 


chamáca 
; recursiveFactorial1) 
L 


Chamada + rétum 1 


recursiveFactorial/l) 


Figura 3.21 Rastreamento recursivo para a chamada recursiveFactorial(4). 


Desenhando uma régua inglesa 


Como um exemplo mas complexo de recursão, pode-se desenhar as marcas de uma régua in- 
glesa tipica. A régua é dividida em intervalos de 1 polegada é cada intervalo consiste de um 
conjunto de marcas dispostas a intervalos de tá polegada, 54 de polegada е assim por diante. 
A medida que o intervalo é reduzido à metade, o comprimento da marca é reduzido em uma 
unidade. (Ver Figura 3.22.) 

Cada múltiplo de polegada tem um rótulo numérico. O maior comprimento de marca é cha- 
mado de comprimento de marca principal. Entretanto, não existe preocupação com as distâncias 
reais, sendo impressa apenas uma marca por linha. 
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---- bf amam. 0 --- $ 
---- 1 ---- --- 2 
22-2 ee 

la) (b) (e) 


Figura 3.22 Trés exemplos de saída da função de desenho da régua: (a) régua de 2 polegadas 
com a maior marca de comprimento 4; (b) régua de 1 polegada com a maior marca de compri- 
mento 5; (c) uma régua de 3 polegadas com a maior marca de comprimento 3. 


Abordagem recursiva para o desenho da régua 


A abordagem para o desenho da régua consiste em trés funções. A função principal, drawRulert ) 
desenha a regra inteira. Seus argumentos são o número total de polegadas da régua, ninches, e o 
comprimento de marca principal, majorLength. À função utilitária, drawOneTick( ), desenha uma 
única marca de um certo comprimento. Ela também pode receber um rótulo inteiro opcional que 
é impresso se não for negativo. 

O trabalho mais interessante é feito pela função recursiva, drawTicks( j, que desenha a sc- 
quência de marcas de um intervalo. Seu único argumento é o tamanho da marca associada com a 
marca central do intervalo, Considere-se a régua de | polegada com marca principal de tamanho 
5, apresentada na Figura 3.22(b). Ignorando as linhas que contém Ce 1, procura-se desenhar а 
sequência de marcas que ocorrem entre essas duas, A marca central ( 4 polegada) tem tamanho 
4, Nota-se que os dois padrões de marcas, acima e abaixo da marca central, são idénticos, e que 
cada um tem uma marca central de tamanho 3. Normalmente, um intervalo com uma marca cen- 
tral de tamanho L = | é composto da seguinte forma: 


e Um intervalo com uma marca central de comprimento L—1. 
ж Uma única marca de tamanho iL. 
* lim intervalo com uma marca central de tamanho £— 1. 


A cada chamada recursiva, o comprimento diminui de um. Quando o comprimento che- 
gua zero, simplesmente retorna-se. Como resultado, este processo recursivo sempre terminará. 
[sso sugere um processo recursivo no qual o primeiro e o último passo são executados cha- 
mando-se drawTicks(L = 1) recursivamente. O passo do melo é executado chamando a função 
drawOneTick(£). Está formulação recursiva é apresentada no Trecho de código 3.30. Como no 
exemplo do fatorial, o código tem um caso base (quando L = 0), Nesta instância, são feitas duas 
chamadas recursivas para a função. 

// desenha uma marca sem rótulo 
public static void drawOneTick(int tickLength) { drawOneTick(tickLength, — 1); } 
// desenha uma marca 
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public static void drawOneTick(nt tickLength, int tickLabel) ( 
for (int i = 0; i < tickLength; i++) 
System.out.print(" - =); 
If (tickLabel >= 0) System.out.print(^ " +tickLabel); 
System.out.print(* n"); 


} 
public static void drawTicks(nt tickLength) |  desenha marcas de um certo comprimento 
if (tickLength > 0) { ‘/ para quando o comprimento chega a 0 
drawTicks(tickLength— 1); H desenha recursivamente as marcas da esquerda 
drawQneTickitickLength); /! desenha a marca central 
drawTicks(tickLength-— 1); і! recursivamente desenha as marcas da direita 
| } 
public static void drawRuler(int ninches, int majorLength) { // desenha a régua 
drawOneTick(majorLength, 0); // desenha a marca 0 e seu rótulo 
for (int i = 1; i <= ninches; i++) { 
drawTicks(majorLength — 1); if desenha as marcas para esta polegada 
drawOneTick(majorLength, i); // desenha a marca i e seu rótulo 
} 
} 


Trecho de código 3.30 Uma implementação recursiva de uma função que desenha uma régua. 


llustrando o desenho da régua usando rastreamento recursivo 


A execução recursiva da função recursiva drawTicks, definida anteriormente, pode ser visualiza- 
da usando-se rastreamento recursivo. 

Entretanto, o rastreamento para drawTicks é mais complexo que no caso do exemplo do fa- 
torial, porque cada instância faz duas chamadas recursivas. Para ilustrar este fato, apresenta-se o 
rastreamento recursivo de uma forma que lembra o esboço de um documento, (Ver Figura 3.23.) 

Ao longo deste livro, serão vistos vários outros exemplos de como a recursão pode ser usada 
no projeto de estruturas de dados e algoritmos. 


Outras demonstrações de recursão 


Como discutido anteriormente, recursão é um conceito que define um método que chama a si 
mesmo. Quando isso ocorre, denomina-se de chamada recursiva. Também se considera como 
recursivo um método M, se ele chama outro método que chama M de volta. 

O maior benefício da abordagem recursiva no projeto de algoritmos é que nos permite tirar 
vantagem da estrutura repetitiva presente em muitos problemas. Fazendo a descrição dos algorit- 
mos explorarem esta estrutura repetitiva de uma forma recursiva, pode-se evitar a análise de ca- 
sos complexos e o uso de laços aninhados. Esta abordagem pode levar a descrições de algoritmos 
mais legíveis e ainda manter a eficiência. 

Além disso, o uso da recursão é útil para definir objetos que tenham uma estrutura repetitiva 
similar, como nos exemplos que seguem. 


Exemplo 3.1 Sistemas operacionais modernos definem os diretórios do sistema de arquivos 
(também conhecidos como "pastas ") de uma forma recursiva, Na verdade, um sistema de argui- 
vas consiste em um diretório de mais alto nível e o contetido deste diretório compreende arquivos 
e outros diretórios, que podem, por sua vez, conter arquivos e diretórios, e assim por diante. Os 
diretórios base de um sistema de arquivos contêm apenas arquivos, mas usando esta definição 
recursiva, o sistema operacional permite que os diretórios sejam aninhados em qualquer profun- 
didade (enquanto houver espaço na meméria ). 
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Output 


drawTicks(3) 


drawTicks[2) 


бга тке} 
draw Ticks(D) 


drawOneTick(1) —e — 


drawOneTick(2) ————+ — = 


drawTicks(1) 


draw Teksti) 


drawOneTick(1) == — 


draw TicksiD) 


drawTicks(2) 


| (o padrão anterior se repete) 


Figura 3.23 Rastreamento recursivo parcial para a chamada drawTicks(3). O segundo padrão 
de chamadas para drawTicks(2) não é mostrado, mas é idéntico ao primeiro. 


Exemplo 3.2 Grande parte da sintaxe das linguagens de programação modernas são definidas 
de forma recursiva. Por exemplo, pode-se definir uma lista de argumentos em Java usando a 


seguinte notação: 


lista de argumentos: 
argumenta 
lista de argumentos, argumenta 


Em outras palavras, uma lista de argumentos consiste tanto em (i) um argumento ow (il) uma 
lista de argumentos, seguida de uma virgula e um argumento. Isto ё, urna lista de argumentos 
é und lista com os elementos separados por virgula, Da mesma forma, expressões aritméticas 
podem ser definidas recursivamente em termos de primitivas (tais como varidvets e constantes) 
e expressões aritméticas, 


Exemplo 3.3 Existem vários exemplos de recursdo na arte e na natureza. Um dos exemplos 
mais clássicos de recursdo usado na arte são as bonecas russas Marryoshka. Cada boneca é 
feita de madeira sólida ou oca, contendo outra boneca Matrvoshka dentro de si. 


3.5.1  Recursão linear 


A forma mais simples de recursão é a recursão linear, na qual um método é definido de maneira 
a fazer, no máximo, uma chamada recursiva cada vez que é ativado, Este tipo de recursão é útil 
quando se analisam os problemas de algoritmo em termos do primeiro ou do último elemento 
mais um conjunto restante que tem a mesma estrutura do conjunto original, 
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Somando os elementos de um arranjo de maneira recursiva 


Supondo, por exemplo, um dado aranjo A cujos n inteiros se deseja somar. Pode-se resolver este 
problema usando recursão linear, observando-se que a soma de todos os т inteiros em A é igual a 
AJO]. se nn = 1. ou a soma dos primeiros л — 1 inteiros de A mais o último elemento de A. Parti- 
cularmente, pode-se resolver este problema de somatório usando o algoritmo recursivo descrito 
no Trecho de código 3.31. 


Algoritmo LinearSurn(A, m): 
Entrada: um arranjo inteiro A é um inteiro n = |, tal que A tenha pelo menos n elementos, 
Saida: o somatório dos primeiros n elementos de A. 
sen = [então 
retorne A[0] 
Senado 
retorne LinearSum(A, n— 1) + A[n— 1] 


Trecho de código 3.31 Somando os elementos de um arranjo usando recursão linear. 


Este exemplo demonstra uma propriedade importante que todo o método recursivo deve res- 
peitar — o método termina. Garante-se esta propriedade escrevendo uma sentença náo-recursiva 
para o caso m = |, Além disso, sempre se executa a chamada recursiva sobre um valor menor 
para o parâmetro (a — 1) do que o fomecido (n), de maneira que em algum ponto (na "base" da 
recursão), será executada a parte nào-recursiva da computação (retomando A [0]). Normalmente, 
um algoritmo que usa recursão linear tem a seguinte forma típica: 


* Testes para os casos base: inicia-se testando o conjunto de casos base (pode ser ape- 
nas um). Estes casos base devem ser definidos de maneira que toda possível cadera 
de recursão eventualmente atinja um deles, e o tratamento dos mesmos não pode usar 
recursão, 

* Recursão: após os testes dos casos base, executa-se à chamada recursiva, Este passo 
recursivo deve envolver o teste que decide qual das diferentes possibilidades de chamado 
recursiva fazer. mas deve escolher apenas uma destas chamadas por vez que executar este 
passo, Além disso, deve-se definir cada chamada recursiva possivel de maneira que leve 
em direção a um caso base, 


Analisando algoritmos rec ursivos usando rastreamento recursivo 


Pode-se analisar um algoritmo recursivo usando uma ferramenta visual conhecida como ras- 
ireamento recursivo, Usou-se rastreamento recursivo, por exemplo, para analisar е visualizar à 
função Fibonacci, da Seção 3.5, da mesma maneira que é usado com os algoritmos de ordenação 
recursivos das Seções 11.1 e 11.2. 

Para desenhar um rastreamento recursivo, cria-se uma caixa para cada instância de método e 
rotula-se o mesmo com seus parâmetros. Então, visualiza-se as chamadas recursivas desenhando 
uma seta que parte da caixa correspondente ao método chamador em direção a caixa correspon- 
dente ao método chamado. Por exemplo, demonstra-se o rastreamento recursivo do algoritmo 
LinearSum do Trecho de código 3,31 na Figura 3.24. Rotula-se cada caixa neste rastreamento 
com os parâmetros usados para fazer a chamada. Cada vez que se faz uma chamada recursiva, 
desenha-se uma linha para à caixa que representa a mesma. Também é possível usar este diagra- 
ma para visualizar os sucessivos passos do algoritmo, uma vez que ele avança da chamada de н 
рага a chamada de n—1, para a chamada de n — 2, e assim por diante, até chegar a chamada de 1. 
Quando a chamada final termina, ele retorna o valor de volta para a chamada de 2, que por sua 
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u I 


u 


LinearSumiA, 4) 
LinearsumjA, 3) 


LinearsSiurmiA, 1) 


Figura 3.24 Rastreamento recursivo para uma execução de LinearSumiA, m) com parámetros 
de entrada A = (4,3,6,2,5) en = 5. 


vez adiciona o valor e retorna a soma parcial para a chamada de 3, e assim por diante, até que a 
chamada de n— | retorne sua soma parcial para a chamada de n. 

А partir da Figura 3.24, deve ficar claro que para um arranjo de entrada de tamanho л, o algo- 
ritmo LinearSum faz n chamadas. Conseqúentemente, ele irá consumir uma quantidade de tempo 
que é aproximadamente proporcional a n, uma vez que o tempo gasto com a parte não-recursiva 
de cada chamada é constante. Além disso, pode-se perceber que a quantidade de memória usada 
pelo algoritmo (além do arranjo A), também é proporcional a п, uma vez que se necessita de uma 
quantidade constante de memória para cada uma das n caixas do rastreamento no momento em 
que se faz a chamada recursiva final (para n = 1). 


Invertendo um arranjo por recursáo 


Na sequência, será analisado o problema de inverter os n elementos de um arranjo, A, de maneira 
que o primeiro elemento se torne o último, o segundo se torne o penúltimo, e assim por diante. 
Pode-se resolver esse problema usando recursáo linear, na medida em que se observa que o invert- 
so de um arranjo pode ser obtido trocando-se o primeiro e o último elemento, e então invertendo 
recursivamente os elementos restantes. Descrevem-se os detalhes deste algoritmo no Trecho de 
código 3.32, usando a convenção de que a primeira vez que este algoritmo é chamado usa-se a 
chamada ReverseArray(A, 0, n— 1). 


Algoritmo ReverseArray( A, i, i 
Entrada: um arranjo A € índices inteiros não negativos ѓе у 
Saida: os elementos de A invertidos começando no indice ғ e terminando em ў 
sei < jentäo 
Inverter Ali] e Ali] 
ReverseArmray(A, i+1,j-1) 
retorna 


Trecho de código 3.52 Invertendo os elementos de um arranjo usando recursão linear. 
Observa-se que neste algoritmo na verdade existem dois casos base, а saber, quando i = je 


quando i > j. Em qualquer um destes casos simplesmente encerra-se o algoritmo, uma vez que 
uma seqóéncia com zero elementos ou uma sequência com um elemento é trivialmente igual a 
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seu inverso. Além disso, observa-se que no passo recursivo garante-se o progresso em direção 
a um destes dois casos base. Se n € impar, o caso É = j será atingido inevitavelmente, e se н for 
par, certamente será atingido o caso é > у. Este argumento implica que o algoritmo recursivo do 
Trecho de código 3.32 garantidamente termina. 


Definindo problemas de maneira a facilitar a recursáo 


Para projetar um algoritmo recursivo para um dado problema, é útil pensar em diferentes manei- 
ras de subdividi-lo, definindo subproblemas que tenham a mesma estrutura geral que o original. 
Este processo significa que algumas vezes é necessário redefinir o problema original para facili- 
tar a obtenção de subproblemas similares. Por exempla, no algoritmo ReverseArray, foram acres- 
centados os parámetros fe у de maneira que a chamada recursiva para inverter a parte interna do 
arranjo А tivesse a mesma estrutura (e mesma sintaxe) que a chamada para inverter todo arranjo 
A. Em função disso, em vez de chamar inicialmente ReverseArrayiA », chama-se ReverseArray(A., 
0, n— 1). Normalmente. se existe dificuldade para se encontrar a estrutura repetitiva necessária 
para projetar um algoritmo recursivo, pode ser útil trabalhar o problema sobre alguns exemplos 
concretos de maneira a entender como os subproblemas podem ser definidos. 


Recursao final 


Em diversas situações, a recursão é uma ferramenta ütil para projetar algoritmos que tem defini- 
ções curtas e elegantes. Mas essa utilidade tem um custo. Quando se usa um algoritmo recursivo 
para resolver um problema, se gasta uma certa quantidade de memória para manter o estado de 
cada chamada recursiva ativa. Quando à memória do computador está escassa, em alguns casos é 
interessante ser capaz de derivar um algoritmo não-recursivo a partir de um recursivo. 

Pode-se usar uma estrutura de dados do tipo pilha, discutida na Seção 5.1, para converter um 
algoritmo recursivo em um algoritmo não-recursivo, mas existem algumas situações em que esta 
conversão pode ser feita de maneira mais simples e eficiente, Em particular, pode-se converter 
facilmente algoritmos que usem recursão final. Um algoritmo usa recursão final” se ele usa re- 
cursão linear e o algoritmo faz uma chamada recursiva como sua última operação. Por exemplo, 
o Trecho de código 3.32 usa recursão final para inverter os elementos do arranjo. 

Entretanto, não é suficiente que o último comando da definição do método inclua uma cha- 
mada recursiva, Para que um método use recursão final, a chamada recursiva deve ser realmente 
a última coisa que o método faz (caso contrário, seria um caso base, é claro). Por exemplo, o al- 
goritmo do Trecho de código 3.31 não usa recursão final mesmo que seu último comando inclua 
uma chamada recursiva. Esta chamada recursiva não é, na verdade, a última coisa que o método 
faz. Após receber o valor retomado da chamada recursiva, ele adiciona este valor em A[n— 1] e 
retorna esta soma, Isto €, a última coisa que este algoritmo faz é uma soma, não uma chamada 
recursiva. 

Quando um algoritmo usa recursão final, pode-se converter o mesmo em um algoritmo não 
recursivo iterando através das chamadas recursivas em vez de chamá-las explicitamente, De- 
monstra-se esse про de conversão revisitando o problema de inverter os elementos de um artar- 
jo. No Trecho de código 3.33, apresenta-se um algoritmo náo-recursivo que executa esta tarefa 
iterando sobre as chamadas recursivas do algoritmo do Trecho de código 3.32. Inicialmente, 
chama-se este algoritmo usando IterativeReverseArray(A, 0, n— 1). 


Algoritmo IterativeRevarseArray(A, d ji 
Entrada: Um arranjo A е indices inteiros não negativos í e j 
Saida: Os elementos de A invertidos, começando no indice i e terminando no índice j 


* N.de T. No original, "Vail Kecursian" 
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enquanto i < j faça 
Inverta Ali] e AL] 
{ — {+ 1 


Trecho de código 3.33 Invertendo os elementos de um arranjo usando iteração, 


3.5.2 


Recursão binária 

Quando um algoritmo faz duas chamadas recursivas, diz-se que usa recursão binária. Estas cha- 
madas podem, por exemplo, ser usadas para resolver duas metades do mesmo problema, como 
foi feito na Seção 3.5 para desenhar a régua inglesa. Como outra aplicação de recursão binária, 
será revisitado o problema de somar os n elementos de um arranjo de inteiros A, Neste caso, se- 
rão somados os elementos de A da seguinte forma: (i) somando recursivamente os elementos da 
primeira metade de A; (ii) somando recursivamente os elementos da segunda metade de A; e (Hi) 
somando esses dois valores juntos. Os detalhes do algoritmo são fornecidos no Trecho de código 
3,34, que deve ser chamado usando BinarySum(A, O, n). 


Algoritmo BinarySum(A, i, n): 
Entrada: um arranjo A е os inteiros ѓе n 
Saida: A soma dos n inteiros de A iniciando pelo indice i 
sen = | então 
retorna Ali] 
retorna BinarySumia, i, [n/2]) + Binarysum(A, i + [n/21 Lnt2. hy 


Trecho de código 3.34 Somando os elementos de um arranjo usando recursio binária. 


Para analisar o algoritmo BinarySum, será considerado, por simplicidade, o caso onde n é 
potência de 2. O caso geral para n arbitrário é considerado no Exercício R-4.4. A Figura 3.25 
apresenta o rastreamento recursivo de uma execução do método BinarySum(0,8). Rotula-se cada 
caixa com os valores dos parâmetros i e n, que representam с índice inicial e o comprimento da 
sequência de elementos a serem revertidos, respectivamente, Observa-se que as setas do rastrea- 
mento partem de uma caixa rotulada (i, n) para outra rotulada (1, a2) ou (i3-n/2, n/2). Isto é, o 
valor do parámetro n é dividido a cada chamada recursiva, Assim, a profundidade da recursäo, 
isto é, o número máximo de instâncias de métodos que estão ativas ao mesmo tempo é 1 + logni. 
Assim, à algoritmo BinarySum usa uma quantidade de espaço adicional aproximadamente pro- 
porcional a este valor. Isso € um grande aperfeiçoamento em relação ao espaço necessário pelo 
método LinearSum do Trecho de código 3.31. Entretanto, o tempo de execução do algoritmo Bi- 
narySum é também proporcional a rt, uma vez que cada caixa é visitada em um tempo constante 
quando se avança pelo algoritmo e existem 2т — | caixas. 


Figura 3.25 Rastreamento recursivo para a execução de BinarySum(0,8). 
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Calculando números Fibonacci através de recursão binária 


Considera-se o problema de calcular o &-simo número Fibonacci. Na Seção 2.2.3 viu-se que os 
números Fibonacci 540 recursivamente definidos como segue: 


Е, = 0 
Е = | 
Е = Е. +Е, fori>l, 


Aplicando-se diretamente está definição, o algoritmo BinaryFib, apresentado no Trecho de 
código 3,35, calcula a seguência de números Fibonacci usando recursão binária. 


Algoritmo BinaryFib(X): 
Entrada: inteiro não negativo É 
Saida: o k-ésimo número Fibonacci F, 
se k= então 
retorna k 
sendo 
retorna BinaryFib(k —1) + BinaryFib(k — 2) 


Trecho de código 3.35 Cálculo do £-ésimo número de Fibonacci usando recursão binária. 


Infelizmente, apesar da definição de Fibonnaci se parecer com uma recursão binária, usar esta 
técnica é ineficiente neste caso. Na verdade, desta forma ele usa uma quantidade exponencial de cha- 
madas para calcular o k-ésimo número Fibonacci. Mais especificamente, faça nk denotar o número 
de chamadas acionadas na execução de BinaryFib(4). Então, tem-se os seguintes valores para nk. 


n, = 1 

m = 1 

ть = Mtnti-lititi-3j 
ә = m+a+1=34+14+!1=5 
n, = nm. +n,+1=5+3+1=% 
п = at Фі тәтә 1 = 15 
A = п,+т,+]=]5+9+]1=25 
п = Ren +1 =25+15+ | = 41 


т = mtntl=4+25+1=67 


Acompanhando o padrão, percebe-se que o número de chamadas mais que dobra para cada 
dois índices consecutivos. Isto é, n, € mais de duas vezes na, n, € mais de duas vezes n, n, É mais 
de duas vezes n, e assim por diante. Assim n, > o que significa que BinaryFib faz um número 
de chamadas que é exponencial em relação a k, Em outras palavras, o uso de recursão binária 
para calcular números Fibonacci é muito ineficiente. 


Computando Fibonacci usando recursão linear 


O maior problema com a abordagem anterior. baseada em recursão binária, é que o cálculo de 
números Fibonacci é, na verdade, um problema linearmente recursivo. Ele não é um bom candi- 
dato para se usar recursão binária. Fica-se tentado a usar recursáo binária por causa da maneira 
pela qual o k-ésimo número Fibonacci, F, depende dos dois valores anteriores, F,_, e F, .. Mas 
pode-se computar F, de maneira muito mais eficiente usando recursão linear. 

Entretanto, para se usar recursão linear, é necessário redefinir o problema ligeiramente, Uma 
maneira de obter esta conversão é definir uma função recursiva que calcule um par de números 
Fibonacci (Fa F, ,) usando como convenção que F_, = 0. Então se pode usar o algoritmo lingar- 
mente recursivo apresentado no Trecho de código 3.36. 
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Algoritmo LinearFibonacci( K |: 
Entrada: um inteiro não negativo k 
Saida: um par de números Fibonacci (Fp Fy) 
se К = | entio 
retorna (X, 0) 
sendo 
(i, p  LinearFibonacciók = 1) 
retorna (ij, 1) 


Trecho de código 3.36 Calculando o k-ésimo número de Fibonacci usando recursão linear. 


O algoritmo apresentado no Trecho de código 3.36 mostra que usar regressão linear para calcu- 
lar números Fibonacci € muito mais eficiente do que usar recursão binária. Uma vez que cada cha- 
mada recursiva para LinearFibonacci decrementa o argumento £ de 1, a chamada LinearFibonacci(k) 
resulta em uma série de & — 1 chamadas adicionais. Isto é, calcular o k-ésimo número através de 
recursão linear requer k chamadas de métodos. Esta performance é significativamente mais rápida 
que o tempo exponencial exigido pelo algoritmo baseado em recursão binária, apresentado no 
Trecho de código 3,35, Por essa razão, quando se usa recursão binária, deve-se primeiro tentar раг- 
conar completamente o problema em dois (como foi feno com a soma dos elementos do arranjo) 
ou se pode estar convencido de que sucessivas chamadas recursivas são realmente necessárias. 

Normalmente pode-se eliminar chamadas recursivas que se sobrepõe usando mais memória 
para manter os valores anteriores. Na verdade, esta abordagem é a parte central de uma técnica cha- 
mada de programação dinámica, que está relacionada à recursão e é discutida na Seção 12.5.2. 


3.5.3 X Recursáo múltipla 


Generalizando a partir da recursão binária, usa-se recursão multiple quando um método pode 
fazer várias chamadas recursivas, em um número potencialmente maior que dois, Uma das apli- 
cações mais comuns deste tipo de recursão é usado quando se deseja enumerar várias configura- 
ções visando resolver um quebra-cabeças combinatório. Os exemplos que seguem são instâncias 
de quebra-cabeças de soma: 


pot + pan = bib 
dog + cat = pig 
bov + girl = baby 


Para resolver este tipo de quebra-cabeças, é necessário atribuir um dígito único (isto É 0,1, … ,9) 
para cada letra da equação, de maneira a torná-la verdadeira. Tipicamente, resolvem-se quebra-cabe- 
ças com base nas observações “humanas” que se faz de um quebra-cabeças, em particular para elimi- 
nar configurações (isto é, possíveis atribuições parciais de dígitos para letras) até que restem apenas 
configurações válidas para trabalhar, testando-se 4 correção de cada uma. 

Se o número de configurações possíveis não for muito grande, entretanto, pode-se usar um 
computador para simplesmente enumerar todas as possibilidades e testar cada uma delas sem 
empregar observações "humanas". Além disso, tal algoritmo pode usar recursão múltipla para 
trabalhar com as configurações de uma forma sistemática. Apresenta-se o pseudo-código para 
este algoritmo no Trecho de código 3.37. Para manter a descrição suficientemente genérica para 
ser usada com outros quebra-cabeças, o algoritmo enumera e testa todas as segiléncias de com- 
primento £ sem repetições de elementos de um dado conjunto U. Constróem-se as sequências de 
k elementos através dos seguintes passos: 


1. Geram-se recursivamente as sequências de k — | elementos. 
2. Acrescenta-se а cada sequência um elemento que ela ainda não contenha, 
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Por meio da execução do algoritmo usa-se o conjunto L para manter os elementos que nào 
estão contidos na sequência corrente, de maneira que um elemento e ainda não foi usado se e 
somente se e estiverem L, 

Outra forma de analisar o algoritmo do Trecho de código 3.37 é que ele enumera todos as 
tamanhos possíveis para os subconjuntos ordenados de U de tamanho £, e testa cada subconjunto 
como sendo uma possível solução para o quebra-cabeças, 

аги quebra-cabeças de soma, Y = [0,1,2,3,4,5,6,7.8,9,) e cada posição na segiléncia 
corresponde a uma dada letra. Por exemplo, a primeira posição pode ser o lugar de um b, a segun- 
da de um e, a terceira de um y e assim por diante. 


Algoritmo PuzzleSolve(k, 5. LY: 
Entrada: um inteiro 4, uma sequência 5 e um conjunto É, 
Saida: uma enumeração de todas as extensões de 5 de tamanho x que usam elementos de E 
sem repetições. 
Para cada cem U faça 
Remova e de U [e agora está sendo usado | 
Acrescente e no final de 5 
se k = | então 
Teste se 5 é uma configuração que resolve o quebra cabeças 
se 5 resolve o quebra cabeças então 
retorna “Solução encontrada: * $ 
Sendo 
PuzzleSolve(k — 1, 5. £7) 
Coloque e de volta em U (e agora não está sendo usado) 
Remova e do final de & 


Trecho de código 3.57 Resolvendo um quebra-cabeças combinatório pela enumeração e teste 
de todas as configurações possíveis. 


Na Figura 3,26, apresenta-se o rastreamento recursivo de uma chamada para PuzzleSolve(3, 
$ E onde 5 está vazio é U = la, b. c]. Durante a execução, todas as permutações dos 3 ca- 
racteres são geradas e testadas. Observa-se que a chamada inicial faz trés chamadas recursivas, 
cada uma das quais. por sua vez, faz mais duas. Se PuzzleSolve(3, 5. E) for executado sobre um 
conjunto L consistindo em quatro elementos, a chamada inicial teria feito quatro chamadas re- 
cursivas, cada uma das quais teria um rastreamento parecido com о da Figura 5,26. 


chamada inicial 


PuzzleSolver3. (la, b.ch 


PuzzleSolve(2,b [a,cl) Puzzla&alvei(2. cla bi 


Риха a, tbc 


Puzslesolva(, abc) PuzzleScrwe(t ba {ch} Puzalesolvo(1,ca, bj 


abs 


| PuzzieSolve(.ac,[]] 


Puzzle&olve(t bc. fall PuzzleSolve(1,ch, (aj) 


acb bca cha 


Figura 3.26 Rustreamento recursivo para uma execução de PuzzleSolve(3, 5, 07), onde 5 está 
gu р 5 

vazio e (7 = fa, b. c]. Esta execução gera e testa todas as permutações de a, be c. As permuta- 
ções geradas são vistas logo abaixo das respectivas caixas, 


3.6 Exercicios 
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Para obter ajuda e o código-fonte dos exercicios, visite dava.datastructures.net. 


Reforço 
R-3.1 


R-3.4 


R-3.6 


R-3.7 


R-3.10 


R-3.11 


R-3.12 


Os métodos add e remove do Trecho de código 3.3 e 3,4 não mantêm o 
número a de entradas não-nulas do arranjo a. Em vez disso, as células não 
usadas apontam para um objeto null. Mostre como alterar estes métodos 
de maneira que eles mantenham о tamanho atual de a em uma variável de 
instância n. 

Descreva uma forma de usar recursáo para acrescentar todos elementos de 
a em um arranjo n X л (bidimensional) de inteiros. 

Explique como modificar o programa da Cifra de César (Trecho de código 
3,9) de maneira que ele execute codificação e decodificação ROTI3, que 
usa 13 como valor de deslocamento do alfabeto. Como você pode simpli- 
ficar o código de maneira que o corpo do método de decodificação tenha 
apenas uma única linha? 

Explique as alterações que devem ser feitas no programa do Trecho de códi- 
go 3.9, de maneira que ele possa executar a Cifra de César para mensagens 
que são escritas em linguas baseadas em alfabetos diferentes do inglês, tais 
como grego, russo ou hebraico, 

Qual a exceção que é lançada quando advance ou remove do Trecho de 
código 3.25 são chamados sobre uma lista vazia? Explique como modificar 
estes métodos de maneira à Fornecer um nome de exceção mais instrutivo 
para esta condição. 

Apresente uma definição recursiva para uma lista simplesmente enca- 
deada. 

Descreva um método para inserir um elemento no início de uma lista 
simplesmente encadeada. Assuma que a lista ndo usa um nado sentinela 
e, em vez disso, usa а variável head para referenciar o primeiro nodo da 
lista. 

Forneça um algoritmo para encontrar o penultimo nodo em uma lista sim- 
plesmente encadeada onde o último elemento é indicado por uma referén- 
eia next nula. 

Descreva um método não-recursivo para encontrar, avançando pelos enca- 
deamentos, o nodo do meio de uma lista duplamente encadeada com sen- 
tinelas de início e fim. (Observe: este método deve usar apenas navegação 
pelos encadeamentos; não deve usar um contador). Qual é o tempo de exe- 
cução deste método? 

Descreva um algoritmo recursivo para encontrar o maior elemento em 
um arranjo À de n elementos. Qual € o tempo de execução e a memória 
utilizada? 

Desenhe o rastreamento recursivo da execução do método Heverse/rray(A, 
0, 4) (Trecho de código 3.32) sobre o arranjo À = [4,3,6,2,5). 

Desenhe o rastreamento recursivo para a execução do método Puzzlesol- 
ve(3, 5, 0) (Trecho de código 3.37) onde $ está vazio e U = (а, b, c. d]. 
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R-3.13 


R-3,14 


Criatividade 


cl 


C-3.2 


C-34 


CAB 


0-49 


C-3.10 


C-3.11 


Escreva um pequeno método Java que repetidamente seleciona e remove 
aleatoriamente uma entrada de um arranjo até que ele não armazene mais 
entradas, 


Escreva um pequeno método Java para contar o número de nodos em uma 
lista encadeada circular. 


Forneca o código Java dos métodos add(e) e remove(r) para entradas de 
jogos em um arranjo a, como nos Trechos de código 3.3 e 34, exceto que 
agora as entradas não são mantidas em ordem. Assuma que ainda € neces- 
sário manter rr entradas armazenadas nos indices de ат = 1. Tente imple- 
mentar os métodos add e remove sem usar laços, de forma que o número de 
passos que eles executem não dependa de т. 

Faça A ser um arranjo de tamanho м = 2 contendo inteiros de Lan — I, 
inclusive, com exatamente um repetido. Descreva um algoritmo rápido para 
encontrar o inteiro de À que está repetido. 

Seja B um arranjo de tamanho n = 6 contendo inteiros de I ал — 5, inclu" 
sive, com exatamente 5 repetidos, Descreva um bom algoritmo para encon- 
trar às 5 inteiros de A que estão repetidos. 

Suponha que você está projetando um jogo para vários jogadores que tem 
n == 1000 jogadores, numerados de | a т, interagindo em uma floresta en- 
cantada, O vencedor deste jogo é o primeiro jogador que puder encontrar 
todos os demais pelo menos uma vez (cordas são permitidas). Assumindo 
que existe um método meetii, /) que é chamado cada vez que o jogador i 
encontra o jogador ¿(comi fy, descreva uma maneira de manter os pares 
de jogadores que se encontram e quem é o vencedor. 

Apresente um algoritmo recursivo para calcular o produto de dois inteiros 
positivos, m ea, usando apenas adição e subtração. 

Descreva um algoritmo recursivo rápido para inverter uma lista simples- 
mente encadeada L, de maneira que a ordem dos nodos seja o oposto do que 
era antes. Se a lista só tem uma posição, então não há nada a ser feito; a lista 
Já está invertida, Em qualquer outro caso, remova, 

Descreva um bom algoritmo para concatenar duas listas simplesmente en- 
cadeadas, L e M, com sentinelas cabeça, em uma única lista E que contém 
todos os nodos de É seguidos por todos os nodos de M. 

Fornega um algoritmo rápido para concatenar duas listas duplamente enca- 
deadas Le M, com nodos sentinela cabeça е final, em uma única lista E, 
Descreva em detalhes como trocar dois nodos x e v de uma lista simples- 
mente encadeada L fornecidas apenas referências para x e y. Repita este 
exercicio para o caso onde L é uma lista duplamente encadeada. Qual algo- 
rimo consome mais tempo? 

Descreva em detalhes um algoritmo para inverter uma lista simplesmente 
encadeada £ usando apenas uma quantidade constante de espaço adicional 
C MCI. Usar recursáo, 

No quebra-cabeça das Torres de Hanói, existe uma plataforma com três 
pinos, a, be c fincados na mesma, No pino a temos uma pilha de discos, 
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um maior que o outro, de maneira que o menor está no topo е o maior na 
base. O desafio é mover todos os discos do pino a para o pino c, movendo 
um disco de cada vez, de mancira que nunca seja colocado um disco maior 
sobre um disco menor, Veja a Figura 3,27 como exemplo do caso de n = 4, 
Descreva um algoritmo recursivo para resolver o quebra-cabeças das Torres 
de Напоі para qualquer valor de n. (Dica: considere primeiro o subpro- 
blema de mover todos menos o n-ésimo disco do pino a рага outro pino 
usando o terceiro como “armazenamento temporário”) 


Figura 3.27 Desenho do quebra-cabeças das Torres de Handi. 


C-3.15 


С-3.16 


C-3.17 


C-3.20 


C-3,2] 


Descreva um método recursivo para converter um string de digitos no intei- 
ro que ele representa. Por exemplo, "13531" representa o inteiro 13.531. 
Descreva um algoritmo recursivo que conte o número de nodos em uma 
lista simplesmente encadeada, 

Escreva um programa Java recursivo que resultará em todos os suconjuntos 
de um conjunto de л elementos (sem repetir nenhum subconjunto). 


Escreva um pequeno programa Java recursivo que encontre o menor e o 
maior valor de um arranjo de valores int sem usar nenhum lago. 

Descreva um algoritmo recursivo que irá verificar se um arranjo À de in- 
teiros contém um inteiro Ali] que é a soma de dois inteiros que aparecem 
antes em A, isto é, tais que Ali] = AljJ+A[k] para у, k — i. 

Escreva um pequeno método Java recursivo que irá reorganizar um arranjo 
de valores int de maneira que todos os valores pares apareçam antes de 
todos os valores impares. 

Escreva um pequeno método Java recursivo que pega um caracter string £ 
e exibe seu inverso, Assim, por exemplo, o inverso de "post&pana" será 
"впаравіор". 

Escreva um pequeno método Java recursivo que determina se uma string 5 é 
um palindromo, isto é, se é igual ao seu inverso. Por exemplo "racecar" 
e 'gohangasalami imalasagnahos” são palíndromos. 


Use recursão para escrever um método Java para determinar se uma string 
stem mais vogais que consoantes, 

Suponha que são fornecidas duas listas circulares, L e M, isto é, duas listas 
de nodos de forma que cada nodo possui uma referência next nào-nula. 
Descreva um algoritmo rápido para dizer se L е M são na verdade a mesma 
lista de nodos, mas com diferentes (cursores) pontos de partida. 
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С-3.22 


Dada uma lista circular encadeada L contendo um número par de nodos, 
descreva como dividir L em duas listas encadeadas circulares com a metade 
do tamanho. 


Р-3.4 


P-3.5 


P-3.6 


P-3.7 


P-3.8 


Escreva um programs Java para urn classe matriz iuc possa adicionar c 
multiplicar arranjos bidimensionais de inteiros quaisquer. 

Execute o projeto anterior, mas use tipos genéricos de maneira que as ma- 
ипле involvidas possam conter tipos arbitrários de números. 

Escreva uma classe que mantém os dez maiores escores para uma aplica- 
ção de jogo, implementando os métodos add e remove da Seção 3.11, mas 
usando uma lista simplesmente encadeada em vez de um arranjo. 

Execute o projeto anterior, mas use uma lista duplamente encadeada. Além 
disso, sua implementação de remove(i) deve fazer o menor número de des- 
locamentos sobre as conexões para obter a entrada sob o indice i. 

Execute o projeto anterior mas use uma lista que encadeada que seja tanto 
circular como duplamente encadeada. 

Escreva um programa para resover os quebra-cabeças de soma pela enume- 
ração e teste de todas as soluções possíveis. Usando seu programa, resolva 
os três quebra-cabeças fornecidos na Seção 3.5.3. 

Escreva um programa que criptograte e decriptografe usando uma cifra de 
substituição arbitrária. Neste caso, o arranjo de criptografia € uma mistura 
aleatória de letras do alfabeto. Seu programa deve gerar o array aleatório de 
criptografía, seu arranjo correspondente de decodificação e use estes para 
codificar e decodificar uma mensagem, 

Escreva um programa que possa executar a Cifra de César para mensagens 
em inglés que incluam tanto caracteres minúsculos como marúsculos, 


Observacoes sobre o capítulo 


As estruturas de dados fundamentais de arranjos e listas encadeadas, hem como recursão, dis- 
cutidas neste capítulo pertencem ao folclore da Ciência da Computação. Elas foram desertas 
pela primeira vez na literatura de Ciência da Computação por Knuth no seu original livro sobre 
Fundamentos de Algoritmos [62]. 
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4.1 As sete funções usadas neste livro 


Esta seção discute brevemente as sete funções mais importantes usadas em análise de algoritmos, 
São usadas apenas sete funções simples para a maioria das análises feitas neste livro, As seções 
que usam alguma outra função serão marcadas com uma estrela (+), indicando que são opcionais. 
O Apêndice A contém uma lista de outros fatos matemáticos úteis que se aplicam ao contexto de 
análise de algoritmos e estruturas de dados. 


4.1.1 A função constante 
A função mais simples que se pode imaginar é a função constante, Esta € a função, 
fim = с, 


para alguma constante fixa с, tal que c = 5,c = 27 ойс = 2" Isto é, para qualquer argumento 
n, à função constante л) atribui um valor c. Em outras palavras, não importa qual é o valor de п; 
fin) será sempre igual ao valor da constante c. 

Uma vez que se está mais interessado em funções inteiras, à função constante mais funda- 
mental é gin} = 1, е esta é a típica função constante que será usada neste livro. Observa-se que 
qualquer outra função constante, fin) = c, pode ser escrita como uma constante с que multiplica 
ein). Isto é, ln) = cgin) neste caso. 

Por sua simplicidade, a função constante é útil na análise de algoritmos porque caracteriza o 
número de passos necessários para executar uma operação básica em um computador, tal como 
adicionar dois valores, atribuir um valor para alguma variável ou comparar dois valores. 


41.2 A função logaritmo 


Um dos aspectos mais interessantes e talvez mais surpreendentes da análise de estruturas de dados 
е algoritmos é a onipresença da função logaritmo, fin) = logn para alguma constante b > 1, Esta 
função é definida como segue: 


x = log,n see somente se № = д. 


Por definição, log, 1 = 0, O valor ^ é conhecido como а base do logaritmo. 

Calcular a função logaritmo exata para qualquer inteiro л envolve o uso de cálculo, mas pode- 
se usar uma aproximação que é boa o suficiente para o que se propõe, sem cálculo, Pode-se calcular 
facilmente o menor inteiro maior ou igual a log, a, pois este número é igual ao número de vezes que 
se pode dividir a por a até que se obtenha um número menor ou igual a 1. Por exemplo, a avaliação 
de log, 27 é 3, uma vez que 27/3/3/3 = 1. Da mesma forma, a avaliação de log, 64 é 4, uma vez que 
64/4/4/4/4 = 1, e a aproximação para log, 12 é 4, uma vez que 12/2/2/2/2 = 0,75 = 1. A aproxima- 
ção de base 2 surge na análise de algoritmos porque uma operação comum a muitos algoritmos é 
dividir repetidamente uma entrada pela metade. 

Na verdade, uma vez que computadores armazenam inteiros em binário, a base mais comum 
para a função logaritmo em Ciência da Computação é 2. De fato, esta base é tão comum que 
tipicamente não é indicada se for 2. Entáo, será considerado 


log a = log, n. 


Observa-se que a maioria das calculadoras portáteis tem um botão marcado LOG, mas que 
normalmente é usado para calcular o logaritmo de base 10, e não de base 2. 
Existem algumas regras importantes sobre logaritmos, parecidas com as regras de expoente. 
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Proposição 4.1 (Regras de logaritmo) Dados números reais a > 0, b > |, c Oed - 1, 
tem-se que: 


log, ac = log, a + log € 
log, a/c = log, a — log, € 
log, à' = e log, a 
log, a = (log, ay log, 5 

D 


er É ак ata 


La deu dorm 


Também, como uma abreviatura notacional, será usado log” para denotar a função (log ay. 
Em vez de mostrar como se pode derivar cada uma das identidades acima, que derivam todas da 
definição de logaritmos e expoentes, as mesmas serão demonstradas com alguns exemplos. 


Exemplo 4.2 Demonstra-se algumas aplicações interessantes das regras de logaritmos da Pro- 
posição 4.) (usando a convenção usual de que a base do logaritmo é 2, se omitido). 


* login) = log 2 + logn + + log n. pela regra I 
e logí(n/2) = log n — log 2 = log n — 1, pela regra 2 
+ logm = 3log n, pela regra 3 

+ logn —nlog2—nm-*1 = n, pela regra 3 

* logn = (log ny log 4 = (log ny, pela regra 4 

a Pq. =p, pela regra 5 


De uma forma prática, observa-se que a regra 4 fomece uma maneira de calcular o logarit- 
mo de base 2 em uma calculadora que tenha о botão de logaritmo da base 10, LOG, nois 


log, n = LOG mLOG 2 


41.3 Å função linear 
(шга função simples, mas importante, é a função linear, 
Ап) = n. 


Isto é, dado um valor de entrada m, a função linear f atribui o valor т para si mesma. Esta 
função aparece na análise de algoritmos sempre que se tem de executar uma operação básica 
sobre cada um de л elementos, Por exemplo, comparar um número x com cada elemento de um 
arranjo de tamanho n requer n comparações. A função linear também representa o melhor tempo 
de execução que se pode desejar obter para qualquer algoritmo que processa uma coleção de n 
objetos que não estão na memória do computador, uma vez que a própria leitura dos п objetos 
requer n operações. 


4.1.4 A função n-log-n 
A próxima função a ser discutida nesta seção é a função n-log-n. 
fim = a logn. 
ou seja, a função que atribui para uma entrada n o valor de n multiplicado pelo logaritmo de base 
2 de n. Esta função cresce um pouco mais rápido que a função linear e muito mais devagar que 
a função quadrática. Assim, como será mostrado em várias ocasiões. desejando-se melhorar o 


tempo de execução da solução de um problema de quadrático para n-log-n, ter-se-á um algoritmo 
que executa muito mais rápido no geral. 
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4.1.5 


A função quadrática 
Outra função que aparece com freqüéncia na análise de algoritmos € a função quadrática, 
fin) = n. 


Isto é, dado um valor de entrada н, a função f atribui o produto de rr por si mesmo (em outras 
palavras, ^m ao quadrado”). 

A principal razão de a função quadrática aparecer na análise de algoritmos é que existem wä- 
rios algoritmos que possuem lagos aninhados, onde o laço mais interno executa uma quantidade 
linear de operações e o lago mais externo é executado um nümero linear de vezes. Assim, nestes 
casos, o algoritmo executa n^ n = "m operações. 


Laços aninhados e a função quadrática 


А função quadrática também pode surgir no contexto de laços aninliados onde a primeira iteração 
do lago usa uma operação, a segunda usa duas, a terceira usa trés с assim por diante. Esto é, o 
número de operações é 


| + 2+3+---+ fn — 21 + (a 1) +n. 


Em outras palavras, este será o total de operações executadas pelo lago mais interno se o 
número de operações dentro do lago crescer uma unidade a cada iteração do laço mais externo. 
Esta quantidade também está relacionada a uma história interessante. 

Em 1787, um professor alemão de colégio decidiu manter seus pupilos de nove e dez anos ocu- 
pados adicionando os inteiros de 1 a 100, Mas quase imediatamente, uma das crianças manifestou 
ter encontrado a resposta O professor ficou cismado porque o aluno tinha apenas a resposta em sua 
lousa. Mas estava correta — 5050 — € o estudante, Carl Gauss, cresceu e se tornou um dos maiores 
matemáticos de seu tempo. Suspeita-se que o jovem Gauss usou a seguinte identidade. 


Proposição 4.3 Para qualquer inteiro = É tem-se que: 


пів +1 
E: T PCT А): 


São fornecidas duas justificativas “visuais” para a Proposição 4.3 na Figura 4.1. 

A lição aprendida a partir da Proposição 4.3 é que se executa um algoritmo com laços ani- 
nhades de maneira que as operações do lago mais interno crescem uma de cada vez, então a 
quantidade total de operações ё quadrática em relação ao número de vezes, m, que o lago mais 
externo é executado. Mais especificamente, o número de operações É TES ni2. Neste caso, o que 
é um pouco mais do que o fator constante (1/2) vezes a Função quadrática nº. Em outras palavras, 
tal algoritmo é ligeiramente melhor que um algoritmo que usa n operações cada vez que o laço 
interno é executado. Esta observação inicialmente aparenta não ser intuitiva, mas é sempre ver- 
dade, como mostra a Figura 4.1. 


4.1.6 


A função cúbica e outras polinomiais 


Continuando a discussão sobre funções que são potência de sua entrada, considera-se a função 
chica, 


An} = т, 
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ü 
(a) 
Figura 4.1 Justificativas visuais da Proposição 4.3. Ambas ilustrações visualizam a identidade 
em termos do total de área coberto por n retângulos unitários com alturas 1, 2,..., т. Em (a) 


os retângulos são mostrados de maneira a cobrir um grande triângulo com área n'I2 (base ne 
altura n) mais л pequenos triángulos de área 55 cada (base | e altura 1). Em (b), que se aplica 
apenas quando n é impar, os retângulos são mostrados cobrindo um grande retângulo de base 
ni2 e altura n + 1. 


que atribui para um valor de entrada n o produto de т por ele mesmo trés vezes. Esta função 
aparece com menos frequência no contexto da análise de algoritmos do que as funções constante, 
linear ou quadrática previamente mencionadas, mas aparece de vez em quando, 


Polinomiais 
De maneira interessante, as funções listadas até agora podem ser vistas todas como sendo parte 


de uma classe maior de funções, os polinômios. 
Uma função polinomial é uma função da forma, 


fima +ап+ ан +ат +5 Фан, 


onde dy a, +++, a, são constantes chamadas de coeficientes do polinômio е a, + 0.0 inteiro d, 
que indica a maior potência do polinômio, é chamado de grau do polinômio. 
Por exemplo, as funções a seguir são polinomiais: 


» fin) = 2 + 5n m 
e Йл) = 1+ п 

* fin) = I 

* finn 

è fin) = п". 


Por essa razão, pode-se argumentar que este livro apresenta apenas quatro funções impor- 
tantes usadas na análise de algoritmos, mas, teimosamente, insistiremos que são sete, uma vez 
que as funções constante, linear e quadrática são muito importantes para serem agrupadas com 
as demais polinomiais. Tempos de execução que são polinomiais com um grau d, em geral são 
melhores que tempos de execução polinomiais com um grau mais alto. 
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somatórios 
Uma notação que aparece com freqüéncia em análise de estruturas de dados e algoritmos é o 
somatório, que é definido como segue: 
E 
Y fü) f(a)* f(a+1)+ f(a 2) f(b), 
onde a e b são inteiros e a = b. Somatórios surgem na análise de estruturas de dados e algoritmos 
porque os tempos de execução dos laços correspondem naturalmente à somatórios. Usando a 
nação de somatório, pode-se reescrever a fórmula da Proposição 4.3 como 
Yi — nnl) 
pa Sar 
yal z 
Da mesma forma, pode-se escrever uma polinomial Are) de grau d com coeficientes a... + 
а COMO 
fín)2 Yan. 
pil 
Assim, a notação de somatório fornece um atalho para expressar somas de termos crescentes 
que tem uma estrutura regular. 
4.1.7  Afuncáo exponencial 


Outra função usada na analise de algoritmos é a função exponencial, 
fin) =, 


onde b é uma constante positiva, chamada base, e o argumento n é o expoente, [sto é, a função 


fn) atribur ao argumento de entrada n o valor obtido pela multiplicação da base b por si mesma 


n vezes. Na análise de algoritmos, a base mais comum para a função exponencial é b = 2, Por 
exemplo, se existe um laço que começa executando uma operação e dobra o número de operações 
executadas a cada iteração, então o número de operações executadas pela n-ésima iteração é 2. 
Além disso, uma palavra inteira contendo n bits pode representar todos os Inteiros não negativos 
menores que 2". Assim, a função exponencial de base 2 É muito comum, A função exponencial 
também será chamada de função expoente. 

Entretanto, algumas vezes ocorrem outros expoentes além de m; consequentemente, é útil 
conhecer algumas regras práticas para se trabalhar com expoentes. Em especial, as seguintes 
Regras de Expoentes são muito úteis 


Proposição 4.4 (Regras de Expoente): — Dados os inteiros positivos a, b, c tem-se que 


1. (EY =h 
2 FH = RF" 
3, nb = 


Por exemplo, tem-se o seguinte: 


e 256 = 16 = (2 y = 2! = 7 = 256 (Regra de Expoente 1) 


e 243 = 3 5 37 ш Y3 «9-27 ш 243 (Regra de Expoente 2) 
е 16 = 1024/64 = 2^/2^ 2 2" = Y = 16 (Regra de Expoente 3). 


Ferramentas de Análise 155 


Pode-se estender a função exponencial a expoentes que são frações ou números reais e para 
expoentes negativos como segue. Dado um inteiro positivo É, define-se b como sendo a k-ésima 
raiz de 5, isto é, o número r tal que É = b. Por exemplo, 25"? = 5 uma vez que 5º = 25, Da mes- 
ma forma, 27^ = 3e 16 = 2, Esta abordagem permite definir qualquer potencia cujo expoente 
possa ser expresso como uma fração. pois b^ = (h^), pela Regra dos Expoentes 1. Por exemplo, 
9º = (9% = 729º = 27, Assim, b" é na verdade a c-ésima raiz da integral exponencial Б^, 

Pode-se também estender a função exponencial para definir b^ para qualquer número real x, 
calculando uma série de números da forma 5" para frações alc que se aproximam cada vez mais 
de x. Qualquer número real x pode ser aproximado arbitrariamente por uma fração exc; consegiien- 
temente, pode-se usar a fração a/c como expoente de b para ficar muite próximo de b^, Assim, por 
exemplo, o número 2^ está hem definido, Finalmente, dado um expoente negativo d, define-se pé 
= 1/6“, o que corresponde à aplicação da regra de expoente 3 coma = Dec = — d. 


Somas geométricas 


Suponha que existe um laço onde cada iteração usa um fator multiplicativo maior que o anterior. 
Este laço pode ser analisado usando a seguinte proposição. 


Proposição 4.5 Para qualquer inteiro n = 0 e qualquer número real tal que a > Ое а |, 
considera-se o somatório 


Ш 
Уа = | афа + +a* 


"m 
E р "e Ae 
(lembrando que а = | sea > 0). Este somatório é igual a 


g"-] 


a] 


Somatório, como o mostrado na Proposição 4.5, é chamado de somatório geométrico, por- 
que cada termo é geometricamente maior que o anterior se a > 1. Por exemplo, todo mundo que 
trabalha em computação deve saber que 


[+2+4+Ё+---+2!ш2°—- 1, 


porque este é o maior inteiro que pode ser representado em notação binária usando n bits. 


4.1.8 Comparando taxas de crescimento 
Resumindo. a Tabela 4.1 mostra cada uma das sete funções mais comuns usadas em análise de 


algoritmos, descritas anteriormente, pela ordem. 


constante | logaritmo | linear | n-log-n | quadrática | cúbica | exponencial 


f. 1 
| log n nlogmn n m | a" 


Tabela 4.1 Classes de funções. Assume-se que a > | é uma constante, 


Idealmente, se gostaria que as operações de estruturas de dados executassem em tempos de 
execução proporcional as funções constante ou logarítmica e seria desejável que os algoritmos 
executassem em tempo linear ou n-log-n. Algoritmos com tempos de execução quadráticos ou 
cúbicos são pouco práticos, mas algoritmos com tempos de execução exponenciais são imprati- 
cáveis a não ser para pequenas entradas. O gráfico das sete funções pode ser visto na Figura 4.2. 
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Figura 4.2 Taxas de crescimento para as sete funções fundamentais usadas em análise de algo- 
ritmos. Usa-se a base a = 2 para a função exponencial. As funções são traçadas em um quadro 
di-log para comparar as taxas de crescimento principalmente pelas inclinações. Mesmo assim, 
para mostrar todos os seus valores no gráfico, a função exponencial cresce muito rapidamente. 
Também se usa notação científica para os números, onde aE+b denota а 10". 


As funções de arredondamento para cima e arredondamento para baixo 


Um comentário adicional em relação às funções vistas se aplica. O valor de um logaritmo tipi- 
camente não é um inteiro, enquanto que o tempo de execução de um algoritmo é normalmente 
expresso em termos de quantidades inteiras, tais como a quantidade de operações executadas. As- 
sim, à análise de um algoritmo pode algumas vezes envolver o uso das funções arredondamento 
para cima e arredondamento para baixo, que são definidas, respectivamente, como segue: 


a Lx] = ao maior inteiro menor ou igual a х. 
e [х] = à menor inteiro maior ou igual а x. 


4.2  Análise de algoritmos 


Em uma história clássica, o famoso matemático Arquimedes foi chamado para determinar se 
uma coroa de ouro solicitada pelo rei era de ouro puro e não com parte de prata, como um in- 
formante estava apregeando. Arquimedes descobriu uma maneira de fazer esta análise enquanto 
entrava em uma banheira (grega). Ele notou que a água que espirrava para fora da banheira era 
proporcional a ele que estava entrando. Percebendo as implicações deste fato, ele imediatamente 
saiu da banheira e correu nu pela cidade gritando: “Eureka, eureka!", pois tinha descoberto uma 
ferramenta de análise (deslocamento), que combinada com uma simples escala, podia determinar 
se a coroa do rei era boa ou não, Isto €, Arquimedes podia mergulhar a coroa e uma massa com o 
mesmo peso de ouro em uma bacia com água e verificar se ambos deslocavam a mesma guanti- 
dade, Esta descoberta foi uma infelicidade para o ourives, entretanto, porque quando Arquimedes 
fez sua análise, a coroa deslocou mais água que a massa de ouro com o mesmo peso, indicando 
que a coroa não era, de fato, de curo puro. 

Neste livro o interesse está no projeto de “bons” algoritmos e estruturas de dados. De uma 
forma simples, uma estrutura de dados é uma forma sistemática de organizar e acessar dados, e 
um algoritmo é um procedimento passo a passo para executar alguma tarefa em tempo finito. Es- 
tes conceitos são fundamentais para computação, mas para ser capaz de classificar uma estrutura 
de dados ou algoritmo como sendo “bom”, são necessárias formas de analisar os mesmos. 

A ferramenta principal de análise que será usada neste livro envolve a caracterização dos 
tempos de execução dos algoritmos e das operações sobre as estruturas de dados, sendo que o 
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espaço utilizado também é importante, Tempo de execução é uma medida natural de “qualidade”, 
uma vez que o tempo & um recurso precioso — soluções computacionais devem executar o mais 
rápido possível, 

Normalmente, o tempo de execução de um algoritmo ou método de estrutura de dados cresce 
com o tamanho da entrada, embora, possa variar para diferentes entradas do mesmo tamanho, 
Além disso, o tempo de execução pode ser afetado pelo ambiente de hardware (reflexo do proces- 
sador, velocidade do clock, memória, disco, etc) e de software (reflexo do sistema operacional, 
linguagem de programação, compilador, interpretador etc) no qual o algoritmo é implementado, 
compilado e executado. Se todos os demais fatores forem iguais, o tempo de execução do mesmo 
algoritmo sobre o mesmo conjunto de entradas será menor se o computador tiver um processa- 
dor mais rápido ou se a implementação foi feita em um programa compilado em código nativo 
da máquina em vez de uma execução interpretada em uma máquina virtual, Todavia, apesar das 
possibilidades de variação que se originam em diferentes fatores de ambiente, deseja-se Tocar no 
relacionamento entre o tempo de execução de um algoritmo e o tamanho da entrada. 

Deseja-se caracterizar o tempo de execução de um algoritmo como função do tamanho da 
entrada. Mas qual é a maneira adequada de medir isso? 


421 Estudos experimentais 


Se um algoritmo foi implementado, pode-se estudar seu tempo de execução, executando o 
mesmo sobre diferentes conjuntos de entradas e armazenando o tempo real gasto em cada exe- 
cução. Felizmente, tais medidas podem ser feitas de forma bastante precisa, usando chamadas 
do sistema incluídas na linguagem ou no sistema operacional (por exemplo, usando o método 
system.currentTimeMilis() ou chamando o ambiente de execução com o perfil habilitado). Este 
teste atribui um tempo de execução para um tamanho de entrada específico, mas se o interesse 
for determinar a dependência geral do tempo de execução sobre o tamanho da entrada. Para de- 
terminar esta dependência, devem-se executar vários experimentos sobre diferentes conjuntos 
de entrada, com diferentes tamanhos. Então, se podem visualizar os resultados destes experi- 
mentos plotando a performance de cada execução do algoritmo como um ponto com coordena- 
da x igual ao tamanho da entrada, n, e com a coordenada v igual ao tempo de execução, г. (Wer 
a Figura 4.3.) A partir desta visualização e dos dados que a suporta, pode-se fazer uma análise 
estatistica que procura ajustar a melhor função para o tamanho dos dados experimentais. Para 
ser mais clara, esta análise requer que se escolham boas amostras e testes suficientes para que 
possam ser capazes de fazer afirmações estatísticas razoáveis sobre o tempo de execução do 
algoritmo. 

Apesar dos estudos experimentais sobre os tempos de execução serem úteis, eles tem trés 
grandes limitações: 


* Experimentos så podem ser feitos sobre um conjunto limitado de entradas de teste; conse- 
quentemente, são deixados de fora os tempos de execução das entradas não incluidas nos 
experimentos (e estas entradas podem ser importantes}, 

* É dificil comparar os tempos de execução de dois algoritmos, a menos que os experimen- 
tos sejam executados nos mesmos ambientes de hardware e software. 

e É necessário implementar e executar o algoritmo de maneira a estudar seu tempo de exe- 
cução experimentalmente. 


Este último requisito é óbvio, mas provavelmente é o aspecto que mais consome tempo na 
execução de uma análise experimental de um algoritmo. As outras limitações também impõem 
barreiras sérias, é claro, Assim, idealmente deve-se dispor de uma ferramenta de análise que per- 
mita evitar à execução de experimentos. 
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Figura 4.3 Resultados de um estudo experimental sobre o tempo de execução de um algoritmo. 
Um ponto de coordenadas (m, fb indica que sobre uma entrada de tamanho n, o tempo de execu- 
cdo do algoritmo é milissegundos (ms). 


No restante deste capítulo, desenvolve-se uma maneira geral de analisar os tempos de exe- 
сисао de algoritmos que: 


* considera todas as entradas possíveis, 

а permite que se avalie a eficiência relativa de quaisquer dois algoritmos de uma forma 
independente dos ambientes de hardware е software; 

è pode ser executada estudando-se descrições de alto-nivel de algoritmos sem ter de imple- 
mentá-lo ou executar experimentos. 


Esta metodologia visa associar, com cada algoritmo, uma função fim) que caracteriza o tem- 
po de execução do algoritmo como uma função do tamanho da entrada п. Funções típicas que 
sendo encontradas incluem as sete funções mencionadas anteriormente neste capitulo. 


4.2.2 Operações primitivas 


Como já foi visto, a análise experimental € importante, mas tem suas limitações. Desejando-se 
analisar um algoritmo em particular sem realizar experimentos para medir seu tempo de execu- 
ção, pode-se fazer uma análise diretamente sobre o pseudocódigo de alto nível. Define-se um 
conjunto de operações primitivas como as que seguem: 

atribuição de valores a variáveis: 

chamadas de métodos; 

operações aritméticas (por exemplo, adição de dois números): 

comparação de dois números; 


ACESSO a um arranjo: 
seguir uma referência para um objeto; 
retorno de um método. 


o. ë ^ 


Contando operações primitivas 


Mais especificamente, uma operação primitiva corresponde a uma instrução de baixo nível com 
um tempo de execução constante. Em vez de tentar determinar o tempo de execução específico 
de cada operação primitiva, simplesmente conta-se quantas operações primitivas são executadas 
è usa-se este número r como uma estimativa do tempo de execução do algoritmo. 
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Esta contagem de operações está relacionada com o tempo de execução em um computador es- 
pecifico, pois cada operação corresponde a uma instrução realizada em tempo constante e existe um 
número fixo de operações primitivas, Nesta abordagem, assume-se implicitamente que os tempos de 
execução de operações primitivas diferentes serão similares. Assim, o número г de operações primi- 
tivas que um algoritmo realiza será proporcional ao tempo de execução daquele algoritmo. 

Um algoritmo pode executar mais rapidamente sobre algumas entradas do que sobre outras 
do mesmo tamanho, Assim, deseja-se expressar o tempo de execução de um algoritmo como uma 
função do tamanho da entrada obtido pela média de todas as possíveis entradas do mesmo tamanho. 
Infelizmente, esse tipo de análise do caso médio costuma ser desafiadora. Ela requer a determinação 
da distribuição de probabilidade do conjunto de entrada, o que normalmente não é tarefa simples, A 
Figura 4.4 mostra de maneira esquemática como, dependendo da distribuição de entrada, o tempo de 
execução de um algoritmo pode estar em qualquer ponto entre o tempo para o pior caso e o tempo 
para o melhor caso. Por exemplo. o que acontece se as entradas forem apenas dos tipos "A" e "D"? 


= шш эш шш шш эш эш шш mm шш ш tempo para e pir casar 


tempo para o caso médio? 


me lemper para o melhor caso 


А B C D E F G 
Distância de entrada 


Figura 4.4 Diferença entre os tempos para o melhor e o pior caso. Cada barra representa o 
tempo de execução de um algoritmo sobre uma entrada diferente. 


Focando no pior caso 


A análise do caso médio normalmente requer que se calcule os tempos de execução esperados 
com base em uma distribuição de entrada, o que, em geral, envolve teoria de probabilidade so- 
fisticada. Em função disso, no restante deste livro, a menos que seja especificado, no entanto, os 
tempos de execução serão caracterizados em termos do pior caso, como função do tamanho da 
entrada, a, do algoritmo. 

A análise do pior caso é muito mais fácil do que a análise do caso médio, pois requer apenas 
a habilidade de identificar a entrada do pior caso, o que normalmente é simples, Além disso, 
tipicamente, essa abordagem conduz a algoritmos melhores. O padrão é que para um algoritmo 
executar bem no pior caso, é necessário que ele execute melhor para as demais entradas. Isto é, 
projetar para © pior caso conduz a algoritmos com mais “músculos”, assim como um especialista 
em trilhas. que sempre pratica subindo um plano inclinado. 


4.2.3 Notacáo assintótica 


Em geral, cada passo em uma descrição em pseudocódigo ou implementação em linguagem de 
alto nivel corresponde a um pequeno número de operações primitivas exceto para chamadas de 
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métodos, naturalmente). Assim, podemos realizar uma análise simplificada de um algoritmo es- 
crito em pseudocódigo que estima o número de operações primitivas executadas, exceto por um 
fator constante, contando os passos do pseudocódigo (mas deve-se ter cuidado uma vez que uma 
linha de pseudocódigo pode denotar vários passos em alguns Casos), 


simplificando a análise 


Na análise de algoritmos, é importante concentrar-se па taxa de crescimento do tempo de execu- 
ção como uma função do tamanho da entrada st, obtendo-se um quadro geral do comportamento, 
em vez de concentrar-se nos detalhes menores. Frequentemente, basta saber que o tempo de exe- 
cução de um algoritmo como arrayMax, apresentado na Seção 1.9.2, cresce proporcionalmente 
à n, com o verdadeiro tempo de execução sendo m vezes um fator constante que depende de um 
computador especifico. 

Estrutura de dados e algoritmos serão analisados usando-se uma notação matemática para fun- 
ções que desconsidera fatores constantes. Desta forma, o tempo de execução de um algoritmo será 
caracterizado usando funções que mapeiam o tamanho da entrada, m, para valores que correspon- 
dem a um fator principal que determina a taxa de crescimento em lermos de s. Entretanto, não será 
definido formalmente o que rr significa; em vez disso, deixar-se-à que n se refira a uma medida do 
tamanho da entrada, que pode ser definida de forma diferente para cada algoritmo que está sendo 
analisado. Esta abordagem permite focar a atenção nos aspectos gerais da função de tempo de execu- 
ção. Além disso, a mesma abordagem permite caracterizar o espaço gasto com estruturas de dados e 
algoritmos, onde se define espaço gasto como a quantidade total de células de memória utilizadas, 


Notação o 


sejam fine gin) funções mapeando inteiros nào-negativos em números reais. Diz-se que fin) č 
EX glad se existe uma constante real e > (fe uma constante inteira nm. = | tais que 


Ani = egte) para todo inteiro a = ji. 


Esta definição é geralmente chamada de notação O, pois geralmente se diz “їп é O de gn)" 
Outra opção é dizer que "fin) é da ordem de gin.” (Esta definição é ilustrada na Figura 4.5.) 


Exemplo 4.6 A função En — 2 é On). 


Justificativa Pela definição da notação 0, é necessário encontrar uma constante c > ( e uma 
constante inteira A, = | tais que än — 23 cn para todo inteiro n = n, E fácil perceber que uma 
escolha podena ser c = 8 еп, = 1. De fato, esta é uma das infinitas escolhas possíveis porque 


ceni 


nei 


Tempo de execução 


Tamanho da entrada 


Figura 4.5  llustrando a notação O A função fir) é Ога), pois fint = c+ gin) quando n = n,. 
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qualquer número real maior ou igual a 8 será uma escolha possível para c e qualquer inteiro 
maior ou igual a | é uma escolha possível para nm, = 


А notação € permite dizer que uma função de fin) é “menor que ou igual a" outra função 
ein) até um fator constante e de uma maneira assintótica à medida que m cresce para infinito 
Esta habilidade vem do fato de que a definição usa “=” para comparar fr) com gin} vezes uma 
constante, c, para o caso assintótico quando п = n, 


Caracterizando tempos de execução usando a notação O 


A notação O é usada largamente para caracterizar à tempo de execução e limites espaciais em 
função de um parámetro + que varia de problema para problema, mas é geralmente definido como 
uma medida escolhida do tamanho do mesmo. Por exemplo, se for necessário encontrar o maior 
elemento em um arranjo de inteiros, como no algoritmo arrayMax, deve-se fazer п representar o nú- 
mero de elementos no arranjo. Usando а notação O pode-se escrever a seguinte afirmação matena- 
ticamente precisa sobre o tempo de execução do algoritmo arrayMax em qualquer computador. 


Proposição 4.7  O algoritmo arrayMax para determinar o maior elemento de um arranjo de n 
inteiros executa em tempo Om; 


Justificativa O número de operações primitivas executadas pelo algoritmo arrayMax em cada 
iteração é constante. Conseqüentemente, como cada operação primitiva executa em um tempo 
constante, pode-se dizer que o tempo de execução do algoritmo arrayMax para uma entrada de ta- 
manho n é no máximo uma constante, vezes n, isto é, pode-se concluir que o tempo de execução 
do algoritmo arrayMax é CH. | 


Algumas propriedades da notação O 


А notação O permite que se ignorem os fatores constantes e os termos de menor ordem, manten- 
do o foco nos principais componentes da função que afetam seu crescimento, 


Exemplo 4,8 5л + 3m + 2n^ + dn + Le Oir. 

Justificativa observe que Sn’ + An Har dnd m(5-3-2-4- Da! 7 cn, para c 
= |5, quando н = m, = 1, E 
Na verdade, pode-se caracterizar a taxa de crescimento de qualquer função polinomial. 

Proposição 4.9 Se fin) é um polinômio de grau d, ist é, 
Fn = a, tante + ап, 
ed, =d, então An) é Mud). 
Justificativa Nota-se que, рага п = |, tem-se que | En = mu... п“; consequentemente, 
tanta, СЕ a, n" 7 (dy Ta ta Toe aW. 
Em função disso, pode-se mostrar que fin) é On") pela definição c = a, +a, * ctae 
n, = 1. = 


Assim, o termo de mais alto grau em um polinômio é o termo que determina a taxa de cres- 
cimento assintótico do polinômio. Propriedades adicionais da notação O são consideradas nos 
exercicios. Entretanto, serão analisados mais alguns exemplos, focando em combinações das sete 
funções fundamentais usadas em projeto de algoritmos. 


Exemplo 4.10 Sn + In loga + 2n +56 On ). 


Justificativa 5л + 3n logn + 2n +5=(5+3+2+ Ser = en, рага с = 15, quando n = n, 
= 2 (observa-se que n log n é zero para n = 1). " 
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Exemplo 4.11 20% + 10n log n + 5 On’). 
Justificativa 20n' + lün logn + 5 = 35m, para n = |. " 


Exemplo 4.12 3logn + 2 ё (оа m). 


Justificativa 3logn + 2 = 5 logn para à = 2. Observa-se que log né zero para n = 1. Por isso 
Usa-se. m = n, = 2 neste caso, п 


Exemplo 4.13 2" 00. 
Justificativa 2 22 =4-+ In: consegiientemente, pode-se usare = 4 eng = 1 neste caso. E 


Exemplo 4.14 2» + 100 log n é (Am). 
Justificativa 2л + 100 log n = 102n, para n = n, = 2; consequentemente, pode-se usar 
c 102 neste caso. m 


Caracterizando funções em termos mais simples 


Em geral, deve-se usar a notação O para caractenzar uma função Go detalhadamente quanto possível. 
Mesmo sendo verdade que a função fm) = An^ + An E СК | ou mesmo On’), € mais preciso dizer 
que An) é Oin 1, Considere, por analogia, um cenário em que um viajante com fome dinge por uma 
estrada do interior e passa por um fazendeiro que está indo para casa voltando do mercado. Quando 
o viajante pergunta quanto ele ainda tem de dirigir até achar comida, pode ser correto o fazendeiro 
responder: "Com certeza são menos de doze horas”. No entanto, € muito mais preciso (e útil} para 
ele dizer: “Você encontra um mercado dirigindo mais alguns minutos por esta estrada”, Da mesma 
forma, na notação O, deve-se fazer um esforço para na medida do possível dizer toda a verdade. 

Também é considerado de mau gosto incluir fatores constantes de termos de menor ordem 
na notação O. Por exemplo, não é elegante dizer que a função In é Cdr” + Gn log т), ainda que 
isso esteja perfeitamente correto. Deve-se fazer um esforço, porém, para descrever a função O 
em termos simples. 

As sete funções listadas na Seção 4.1 são as funções mais comumente usadas em conjunto 
com a notação O para caracterizar os tempos de execução e consumo de memória dos algoritmos, 
Na verdade, comumente usam-se os nomes destas funções para referenciar o tempo de execução 
dos algoritmos que elas caracterizam, Assim, por exemplo, pode-se dizer que um algoritmo que 
executa no pior caso em tempo An on log n como um algoritmo de tempo guadrätico, uma 
vez que ela executa em tempo Om). Da mesma forma, um algoritmo executando em um tempo 
máximo An + 20 log a + 4 será dito um algoritmo de tempo linear. 


Notação omega 


Assim como а notação O fomece uma maneira assintótica de dizer que uma função é “menor que 
ou igual a” outra função, а notação a seguir fornece uma maneira assintótica de dizer que uma 
tunção cresce a uma taxa que é “maior ou igual” a de uma outra função, 

Sejam Am e gl) funções mapeando números inteiros em números reais. Diz-se que fin) é 
(Mel) (pronuncia-se "fin é Ômega de (3%) se gin) é O) ou seja, se existe uma constante 
c > Ое uma constante inteira np = | tais que 

An) coin) param zm, 

Esta definição nos permite dizer que uma função é assintoticamente maior que ou igual a 

outra, exceto por um fator constante. 
Exemplo 4.15 In log mn + 2n é Clin log т). 
Justificativa Зл log n + 2 = 3n log n param = 2 u 
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Notação theta 


Além disso, existe uma notação que permite dizer que duas funções crescem à mesma taxa, até fato- 

res constantes. Diz-se que Am) é gn) (pronuncia-se “An) é theta de gín)”) se fin) é Ogni e An) 

é (Kein): ou seja, existem constantes reais c'> Ое c"» Ое uma constante inteira n, = 1 tais que 
c’ein) -fin)-c"g(n) paran = ne 

Exemplo 4.18 In log n = 4л + 5 log n é Bin log n. 

Justificativa Зп logn = In logn + 4n + 5 log mn = (3-4 5)n log n paran = 2. " 


4.2.4 Análise assintótica 


Suponha que dois algoritmos podem resolver o mesmo problema: um algoritmo A que tem um 
tempo de execução Oin) e um algoritmo B com tempo de execução X’). Qual deles é melhor? 
Sabe-se que n é O(n’), e isso implica que o algoritmo A é assintoticamente melhor do que o 
algoritmo B, embora para algum dado valor (pequeno) de n seja possível que B tenha um tempo 
de execução menor do que A. 

Pode-se usar à notação O para ordenar classes de funções por seu crescimento assintótico. As 
sete funções estão ordenadas por sua taxa de crescimento na sequência que segue, isto é, se uma 
função fa) precede uma função efn) na sequência, então fin) é Olg(n)): 

| løgn nen m nm Y. 


A Figura 4.2 apresenta as taxas de crescimento de algumas funções importantes. 


2.097.152 
16. 777.216 
512 4.608 134.217.728 1,34х 10 


Tabela 4.2 Valores selecionados de funções fundamentais para análise de algoritmos 


Pode-se demonstrar a importância da notação assintótica na Tabela 4,3, Essa tabela explora 
o maior tamanho permitido para os dados de entrada que são processados por um algoritmo em 
1 segundo, | minuto e 1 hora. Ela mostra a importância do bom projeto de um algoritmo, pois 
um algoritmo assintoticamente demorado é facilmente batido para problemas grandes por um 
algoritmo com tempo assintoticamente mais rápido, mesmo que o fator constante do algoritmo 
assintolicamente mais rápido seja pior. 


Tempo n Tamanho máximo de гучна 
aço 1 segundo — 1 minuto 


3 = 150.000 9. 0000 
ze 5 dd = E 


Tabela 4.3 Tamanho máximo de problemas que podem ser resolvidos em um segundo, um 
minuto e uma hora para vários tempos de execução medidos em microssegundos. 
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А importância do bom projeto de algoritmos, entretanto, vai além do que pode ser resolvido 
eficientemente em um dado computador. Como mostrado na Tabela 4.4, mesmo se o hardware 
for drasticamente acelerado, ainda assim não sé pode superar o problema representado por um al- 
goritmo assintoticamente lento. À tabela mostra o novo tamanho máximo de problema que pode 
ser resolvido em um computador 256 vezes mais rápido do que o anterior. 


Tempo de cxecução | Novo tamanho máximo de problema 


Alim | i Som 
Ir lm 
2ч ni 


Tabela 4.4 Aumento no tamanho máximo do problema que pode ser resolvido em um dado 
tempo usando-se um computador 256 vezes mais rápido que o anterior. Cada entrada é dada em 
função de m. o tamanho máximo do problema dado anteriormente. 


4.2.5 


Usando a notação o 


Após estudar a notação O para analisar algoritmos, serão discutidos brevemente alguns tópicos 
relacionados a seu uso. Considera-se pouco elegante dizer “An = Сал)", já que a notação O por 
si mesma transmite а idéia de “menor ou igual”, Da mesma forma, embora comum, não é coreto 
escrever fin) = gta)” (com a relação de "=" mantendo seu sentido usual) já que não faz senti- 
do a declaração "Nein! = fin)". Além disso, é errado dizer "fim = gin ou fa) > O(gin)", 
pois gin} na notação O expressa um limite superior para fir). O mais apropriado é dizer 


"Hn é Oen. 


Para o leitor com maior pendor para a matemática, também é correto dizer, 


«fin € Otgin)." 


pois a notação O denota, tecnicamente, um conjunto de funções. Neste livro, as sentenças usando 
notação O serão apresentadas da forma “Ani é Hein). Mesmo sob esta interpretação, existe 
considerável liberdade para se usar operações aritméticas com a notação O, e com esta liberdade 
exige-se uma certa dose de responsabilidade. 


Palavras de cautela 


Algumas palavras de cautela sobre a nação assintótica podem ser apresentadas neste ponto. 
Primeiro, observa-se que o uso da notação O e suas parentes pode ser um pouco confusa se os 
fatores constantes que elas “escondem” for muito alto. Por exemplo, enquanto é verdade que a 
função 10% n é O(n), se este for o tempo de execução de um algoritmo sendo comparado a um 
outro cujo tempo de execução é lUn log n, será preferido o algoritmo com tempo de execução 
Oin log n), mesmo que o primeiro algoritmo seja linear, e, portanto, assintoticamente mais rá- 
pido. Esta preferéncia se jusufica pelo fator constante, 109 que é chamado de “um googol’, е 
que muitos astrônomos acreditam ser o limite para o número de átomos no universo observável. 
Assim, é improvável que exista algum problema do mundo real com este tamanho de entrada. 
Mesmo assim, usando a nação O, deve-se estar consciente dos fatores constantes e dos termos 
de mais baixa ordem que estão “escondidos”. 

A observação anterior conduz à discussão do que seja um algoritmo “rápido”. De forma ge- 
ral, qualquer algoritmo rodando em tempo Hr log л) (e com um fator constante razoável) pode 
ser considerado eficiente. Mesmo um método com tempo Оп?) pode ser suficientemente rápido 
em alguns contextos, ou seja, quando n é pequeno. Por outro lado, um algoritmo rodando em 
tempo (42%) não pode nunca ser considerado eficiente. 
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Tempos de execução exponenciais 


Existe uma história famosa sobre o inventor do jogo de xadrez. Ele pediu que seu rei lhe pagasse 
um grão de arroz pela primeira casa do tabuleiro, dois pela segunda, quatro pela terceira, oito pela 
quarta, e assim por diante. E um bom exercício de programação escrever um pequeno programa 
que calcule o número de grãos de arroz que o rei teria de pagar. De fato, qualquer programa em 
Java escrito para calcular este número usando uma variável inteira causaria um erro de overflow 
(embora provavelmente a máquina virtual Java não reclamasse). Para representar esse número 
exatamente como um inteiro, é preciso usar a classe Biginteger. 

Na medida em que é preciso diferenciar algoritmos eficientes € ineficientes, é natural 
fazer esta distingáo entre os algoritmos que rodam em tempo polinomial e aqueles que re- 
querem tempo exponencial. Ou seja, faz-se a distinção entre algoritmos que rodam em tempo 
O(n') para alguma constante c > 1 e aqueles cujo tempo de execução é Ob”) para alguma 
constante b > |, Assim como outras noções discutidas nesta seção, esta também deve ser 
acolhida com certa cautela, pois um algoritmo rodando em tempo O(n provavelmente 
não deveria ser considerado muito eficiente. Mesmo assim, a distinção entre algoritmos de 
tempo polinomial e algoritmos de tempo exponencial é considerada uma medida robusta de 
tratabilidade. 

Resumindo, as notações O, (le € fornecem uma linguagem conveniente para a análise de 
estruturas de dados e algoritmos. Como mencionado anteriormente, estas noções são convenien- 
tes porque permitem a concentração nos aspectos gerais, em vez dos detalhes. 


Dois exemplos de análise assintótica de algoritmos 


Encerra-se esta seção analisando dois algoritmos que resolvem o mesmo problema, mas têm 
tempos de execução bastante diferentes. O problema em questão é fazer o cálculo das médias 
preficadas de uma sequência de números. Ou seja, se dispondo de um arranjo X armazenando n 
números, deseja-se compor um arranjo A tal que Ali] seja a média dos elementos X[0], . . ., X[i] 
pwai=0,,..,n= 1. Qu веја, 


A[i]- Eerd 


As médias prefixadas tem várias aplicações em economia e estatística. Por exemplo, dados 
os retornos anuais de um fundo de investimento, pode-se avaliar o retorno médio anual do fundo 
no último ano e nos últimos trés, cinco ou dez anos. Da mesma forma, dados os logs de uso diário 
da Web, um gerenciador de sites pode querer rastrear a tendência da média de uso em diferentes 
períodos de tempo. 


Um algoritmo de tempo quadrático 


O primeiro algoritmo para o problema das médias prefixadas, chamado de prefixAveragest, é 
mostrado no Trecho de código 4.1. Ele calcula cada elemento de A separadamente, de acordo 
com a definição, 


Algoritmo prefixâverages (A): 
Entrada: um arranjo X com n elementos. 
Saida: um arranjo À com n elementos tal que Ali] € a média de ХТО], … Ali]. 
Seja A um arranjo de n números. 
para i — Ü até n — 1 faça 
й 4— 0 
рага j — О até г faça 
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а а + Ху] 
АШ € ai + 1) 
retorne arranjo À 


Trecho de código 4.1 Algoritmo prefixAverages1. 


Esta é a análise do algoritmo prefixAverages1. 


e Inicializar o arranjo A no início e retorná-lo ao final são ações que podem ser feitas com 
um número constante de operações primitivas por elemento de A, e custa tempo On). 

+ Existem dois laços para aninhados, controlados pelos contadores ¡e у, O corpo do laço 
externo (controlado por £P) é executado m vezes para valores т = O... mn = 1, Assim, os 
comandos a = 0 e Afi] = alli + 1) são executados л vezes cada. Isso implica que esses 
diis comandos, mais o incremento е teste do contador i, contribuem com um número de 
operações primitivas proporcional а n, ou seja, An). 

+ Ocorpo do lago interno (controlado por j) é executado É + | vez, dependendo do contador 
i do laço externo. Assim, o comando à = a + X[j] no laço interno é executado 14+243+ 
‚.. + п vezes. Pela Proposição 4,3, sabe-se que 1+2+3+ ... +a = nin + 12, o que 
implica que o comando do lago interno contribui com tempo On’). Um argumento simi- 
lar pode ser feito para as operações primitivas associadas ao incremento e teste de j, que 
também custam tempo On). 


O tempo de execugäo de prefiz&verages1 é dado pela soma dos trés termos. O primeiro € 
segundo termos são Єл e o terceiro é On). Aplicando à Proposição 4,9, tem-se que o tempo de 
execução de prefizâverages 1 é Cn). 

Um algoritmo de tempo linear 


Para calcular médias prefixadas mais eficientemente, pode-se observar que duas médias conse- 


All & кїї + 1) 
retorne arranjo А 


cutivas Ali — 1] e Afi] são similares: 
Alf 7] = RTG + X[/] +. + Af — hi 
Alf) = GIO] + A + --- + Ki — 7] + AW + 1). 

Denotando com 5, a soma prefixada АТО] + Al] +... + Ali], as médias prefixadas podem 
ser calculadas como sendo Ali} = Sø + 1). E fácil manter o controle da soma prefixada corrente 
enquanto se faz a varredura do arranjo X em um laço. Está-se em condição de apresentar o algo- 
ritmo prefixAverages2 no Trecho de código 4.2, 
Algoritmo prafix Averages2(X ): 

Entrada: um arranjo X com n elementos, 

Saida: um arranjo A com n elementos tal que Afi] é a média de X[U], . . ., Xi]. 

Seja А um arranjo de n números. 

х (0 

para i -Ü até n — 1 faça 

sis + Х|] 
| 


Trecho de código 4.2 Algoritmo prefixâverages?. 


Segue a análise do tempo de execução do algoritmo prefixâverages?: 


e Inicializar о arranjo A no início e fim pode ser feito com um número constante de opera- 
ções primitivas por elemento e leva tempo On). 


4.2.6 
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+ Inicializar a variável s no início, leva tempo Oil). 

• Hä um simples lago para que é controlado pelo contador i. O corpo do laço é executado 
m vezes рага ё = 0,..., = |, Assim, os comandos s = y + Alif e Ali] = si + 1) sño 
executados п vezes, cada, Isso implica que estes dois comandos, mais o incremento e teste 
do contador i, contribuem para um número de operações primitivas proporcionais an, isto 
é, CM пу vezes. 


O tempo de execução do algoritmo prefixáverages? é dado pela soma dos três termos. O 
primeiro e o terceiro termo são On), e o segundo termo é 1). Aplicando a Proposição 4.19, 
tem-se que o tempo de execução de prefix&verages2 é (Mn), muito melhor do que o tempo qua- 
drático de prefixAverages1. 


Um algoritmo recursivo para calcular poténcia 


Como um exemplo mais interessante de análise de algoritmos, será considerado o problema de 
aumentar um número x para um inteiro arbitrário não-negativo, n. Isto é, deseja-se calcular a 
Junção potência p(x.n), definida como pina) = x". Esta função tem uma definição recursiva, 
baseada em recursão linear: 

| 


x- pix.n — D) caso contráno 


plxn)= se mnt) 


Esta definição leva à um algoritmo recursivo que usa Cn) chamadas de métodos para calcular 
pinn). Entretanto, pode-se calcular а função potência de forma muito mais rápida, usando a se- 
guinte definição alternativa, também baseada em recursäo linear, que emprega a seguinte técnica: 


| 
_ se n=() 
pixn)zs 1x: pix, in -1)/ 2y se пе impar 
placa i 2y se n é par 


Para demonsirar como esta definição funciona, consideram-se os seguintes exemplos: 


jS – ML ay = Dr = 4^- |6 

P = PA PS AY = HA 32 
+ m jm = any = (Ty E y = (rl 

2 = PER PE 2р2 = 87) = 28, 


Esta definição sugere o algoritmo do Trecho de código 4.3. 


Algoritmo Poweri t, sh: 
Entrada: um número x e um inteiro n = O 
Saida: o valor de x" 
sen = О então 
retorna | 

sen é impar então 
y #— Powerix, (n — 142); 
retomar- yy 

sendo 
y 4 Power(x, n/2) 
retorna y: y 


Trecho de código 4.3 Calculando a função potência usando recursáo linear. 
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"ara analisar o tempo de execução do algoritmo, observa-se que cada chamada recursiva do 
método Power(x.n) divide o expoente, rr, por dois. Conseqüentemente, existem log mn) cha- 
madas recursivas, e não CK n). Isto é, usando recursáo linear e a técnica do quadrado, reduz-se o 
tempo de cálculo da função potência de Hrn) para log rm). o que é uma melhoria significativa. 


4.3 Técnicas simples de justificativa 


Algumas vezes, deseja-se fazer afirmações sobre um algoritmo, Lais como mostrar que ele é 
correto ou executa mais rápido. Para fazer tiis afirmações de forma ngorosa, deve-se usar uma 
argumentação matemática, justificando ou provando nossas afirmações. Felizmente, existem vá- 
ras maneiras simples de fazer isso. 


4.3.1 


Através de exemplos 


Algumas afirmações têm uma forma genérica: "Existe um elemento x no conjunto 5 que tem a 
propriedade P", Para justificar tal afirmação, precisa-se apenas encontrar um x em 5 que tenha a 
propriedade P. Outras afirmações são da forma: "Todo elemento x no conjunto 5 tem a proprie- 
dade P". Para indicar que esta afirmação é falsa, é necessário apenas mostrar um x do conjunto 5 
que não tenha a propriedade Р. Um tal x é chamado de contra-exemplo. 

Exemplo 4.17 Um certo professor Amongus afirma que todo mimero da forma 2 — | é primo, 
se P for maior do que 1. O professor está errado, 

Justificativa Para provar que o professor está errado, precisa-se achar um contra-exemplo. Fe- 
lizmente não se precisa procurar muito, pois 2 — | = 15 = 3-5. = 


4.3.2 


O ataque “contra” 


Outro conjunto de técnicas envolve o uso de negagóes, Os dois métodos básicos são o uso de 
contrapositivos e da contradição. O uso do contrapositivo € como olhar em um espelho negativo: 
para justificar a afirmação “se p é verdade, então q é verdade”, estabelece-se a verdade da afir- 
mação "se q não é verdade então p não é verdade”, Logicamente, essas duas afirmações são egui- 
valentes, mas a segunda, que é a contrapositiva da primeira, pode ser mais fácil de demonstrar. 
Exemplo 4.18 Sejam c e binteíros. Se ab é par então a é par ou b é por 

Justificativa Para justificar essa afirmação, considere seu contrapositivo "se a é impar e bé 
impar, então ab é impar”. Assim, suponha = 4 + bebo 2j + 1 para inteiros ¿e Então 
ah = dij + 2 + At | = 24 + ¿+ Ponanto ab é impar. E 


Além de mostrar o uso da técnica de justificativa contrapositiva, o exemplo anterior também 
contém uma aplicação da Lei de DeMorgan. Essa lei ajuda a lidar com negações, pois ela afirma 
que a negação de "p ou q” assume a forma “não p e não q”. Da mesma forma, estabelece que a 
negação de uma sentença da forma "p e q” é “não p ou não q”. 


Contradição 


Outra técnica de justificativa por negação envolve o uso da contradição, que freqüentemente 
tambén envolve o uso da Lei de DeMorgan. Aplicando a técnica, fica estabelecido que uma 
afirmação q é verdadeira supondo primeiro que ela é falsa e mostrando que esta suposição leva 
a uma contradição (tal como 2 = 2 ou 1 > 3). Chegando a uma contradição, mostra-se que se q 
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for falsa existirá uma situação inconsistente, e portanto q deve ser verdadeira. Naturalmente, para 
chegar a essa conclusão, deve-se ter certeza da existência de uma situação consistente ainda antes 
de supor que q é falsa. 

Exemplo 4.19 Sejam a eb inteiros Se ab é impor entdo a é impar e b é impar 

Justificativa Supõe-se que ab é impar. Deseja-se mostrar que a é impar e que ё ё impar. Assim, 
tentar-se-á obier uma contradição assumindo o oposto, ou seja, que a é par ou b é par. De fata, 
pode-se assumir que a é par (uma vez que o caso de bé simétrico) Entào a = 2j para algum 


inteiro i. Portanto ab = (206 = Mih), ou seja, ab é par. Mas isso ё uma contradição; ab não pode 
ser simultaneamente impar e par. Conseqúentemente, a é impar e bé impar. " 


4.3.3 Indução e invariantes em laços 


А maor parte das afirmações que foram feitas sobre o tempo de execução ou consumo de memó- 
ria de um algoritmo dizem respeito a um parâmetro inteiro n (em geral, representando uma noção 
intuitiva do "tarmanho "do problema). Além disso, a maior parte dessas afirmações equivalem a 
dizer que determinada afirmação gin) é verdadeira "para todon = 1”. Como isso, equivale a 
fazer uma afirmação sobre um conjunto infinito de números: não se pode justificá-la de forma 
exaustiva de forma direta, 


Indução 


Entretanto, freqüentemente pode-se justificar afirmações como as acima apresentadas como ver- 
dadeiras, se for feito uso da técnica da indução. Esta técnica se resume em mostrar que para qual- 
quera = | existe uma sequência finita de implicações que inicia com um fato verdadeiro e leva à 
confirmação de que qin) é verdadeiro, Especificamente, começa-se uma justificativa por indução 
mostrando que gin) é verdadeiro para n = 1 (e possivelmente outros valores s = 2,3,...,k para 
alguma constante KJ. A seguir, justifica-se que o “passo” indutivo é verdadeiro para 1 > k ou seja, 
mostra-se que “se qti) é verdadeiro рага i = n então qii) é verdadeiro”. A combinação dessas 
duas partes completa a justificativa por indução. 

Proposição 4.20 Considere função Fibonacci, Fin) onde se define FD = 1, F(2) = 2, e Fin) = 
Fin = 1) + Fin = 2) para n > 2. (ver Secdo 2.2.3) Afirma-se que Fin) 2. 

Justificativa  Mostra-se que essa afirmação é correta por indução. 

Caso base: (п = 2, Е) = 1 <2 = 2'eF(2)52«4- 2. 

Passo da indução: in > 2). Supondo que a afirmação é verdadeira para n < m. Considere-se 
Fin). Já que n > 2, então Ha) = Fin = 1) + Fin — 2). Além disso, já que 1 — 1 nen — 2 
< п. pode-se aplicar a suposição da indução (às vezes chamada de “hipótese de indução”) para 
implicar que Fimi < Y [+ 77 uma vez que 


ul y on in а A 7. 7" шл" 


Outro argumento indutivo será mostrado, desta vez para um fato já visto antes. 
Proposição 4.21 (que equivale à Proposição 4.3) 


See) 
= "Hmm 


jaj = 


Justificativa А justificativa será feita por indução. 
Caso base: n = 1. E trivial, pois 1 = nía + 112, sen = 1. 
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Passo da indução: n = 2. Supõe-se que a afirmação é verdadeira para п' < n, € considera-se л. 
A n-i 


izn* Vi. 


Pela hipótese de indução, tem-se 


que pode ser simplificada para 


(n=1)n Е In+n’ -H | "nn _ п(п+ 1) 
n+ er ei MET 


E 

Justificar algo verdadeiro para todo п = | às vezes pode ser uma sobrecarga. É necessário 

lembrar, no entanto, que a técnica de indução é bastante concreta: ela mostra que, para qualquer 

n em particular, existe uma segiiéncia de implicações que se inicia com um fato verdadeiro e leva 

a uma verdade sobre n. Resumindo, o argumento indutivo é uma fórmula para construir uma 
seqiiéncia de justificativas diretas. 


Invariantes de laços 


A última técnica de justificativa que será discutida nesta seção é o lago invariante. Para provar 
que uma afirmação $ sobre um laço é correta, defina 5 como uma seqiiéncia de afirmações me- 
NOTES S, 5, ... Sp onde: 


1. a afirmação inicial 5, seja verdadeira antes que o laço se inicie; 

2. se 5, , é verdadeira antes da iteração i, então se pode mostrar que 5, será verdadeira 
depois que a iteração i terminar; 

3. a afirmação final 5, implica que a afirmação $ que se deseja provar é verdadeira. 


De fato, já se viu a técnica da justificativa por invariantes de laços em operação na Seção 
1.9.2 (discutindo a correção do algoritmo arrayMax), mas será visto mais um exemplo aqui. 
Em particular, vamos usar o método para mostrar a correção do algoritmo arrayFind, mos- 
trado no Trecho de código 3.3, que resolve o problema de encontrar um elemento x em um 
arranjo À. 

Algoritmo arrayFind(x,A): 

Entrada: Um elemento x e um arranjo À com n elementos. 

Saída: O índice i tal que x = Ali], ou —1 se nenhum elemento de A é igual a x. 

i €- 0 

enquanto г — n faça 

se x = Ali] então 
retorna i 
senão 
ic + 1 
retorna — | 


Trecho de código 4.4 Algoritmo arrayFind para encontrar um determinado elemento em um 
arranjo. 
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Para mostrar que o algoritmo arrayFind está correto, define-se uma série de afirmações 45, 
que demonstraráo a correção do algoritmo. Especificamente, afirma-se que o seguinte fato € 
verdadeiro no início da iteração i do laço enquanto: 


S: x não é igual a nenhum dos primeiros elementos ide A. 


Essa afirmação é verdadeira no início da primeira iteração do laço, já que não há elementos 
entre o primeiro O de A. (diz-se que este tipo de afirmação trivial é varia) Na iteração i, compara- 
se o elemento x com o elemento Ali] e retorna-se o índice i se eles forem iguais, o que é clara- 
mente correto e completa o algoritmo neste caso. Se os elementos x e Ali] não são iguais, então se 
encontrou mais um elemento diferente de x e incrementa-se o índice i. Assim, a afirmação 5, será 
verdadeira para este novo valor de i; conseqilentemente, será verdadeira no início da próxima 
iteração. Se o lago termina sem nunca retornar um índice em A, então provavelmente tem-se i = 
n. Qu seja, 5, é verdadeiro — não há elementos em A que sejam iguais a x. Portanto, o algoritmo 
está correto ao retornar o valor — 1, indicando que x não está em A. 


4.4 Exercícios 


Para obter auxilio e o código fonte dos exercícios, visite java.datastructures.net. 


Reforço 
R-4.1  Fornega uma descrição em pseudocódigo de um algoritmo de tempo On) 


para calcular a função potência pinat. Desenhe também o reastreamento 
recursivo deste algoritmo para o cálculo de p(2,5). 

R-4.2  Fornega uma descrição em Java do algoritmo Power para calcular a função 
potência pix). (Trecho de código 4.3) 

R-4.3 Desenhe o rastreamento recursivo do algoritmo Power, (Trecho de código 
4.3), que calcula a função potência piv mr) para pl 2,9). 

R-4.4 Analise o tempo de execução do algoritmo BinarySum (Trecho de código 
3.34) usando valores arbitrários para o parámetro n. 

R-4.5 Desenhe o gráfico das funções In, An log n. Ut, nt e 2" usando uma escala 
logarítmica para os eixos x e v, isto é se o valor da função fin) é y, desenhe 
este ponto com a coordenada x em log x em log n e a coordenada y em log y. 

R-4.6 О número de operações executadas pelos algoritmos A e Bé 8a log ne In’, 
respectivamente. Determine n, tal que A seja melhor que & para n = Hy 

R-4.7 О número de operações executadas pelos algoritmos A è B é 40л° e 2n, res- 
pectivamente. Determine a, de maneira que A seja melhor que B рага л = п. 

R-4% Apresente um exemplo de função cujo desenho seja o mesmo tanto em uma 
escala logarítmica como em uma escala padrão. 

R-49 Explique porque o desenho da função т é uma linha reta com inclinação c 
em uma escala logarítmica. 

R-4.10 Qual é a soma de todos os números pares de O a 2n, para qualquer inteiro 
positivo? 
Е-4.11 Mostre que as duas afirmações a seguir são equivalentes: 

(a) O tempo de execução do algoritmo A é СМА). 
(Б) No pior caso, o tempo de execução do algoritmo A é iini). 
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R-4.12 


R-4.13 


R-4.14 


R-4,15 


R-4.16 


R-4,17 


R-4.18 


R-4.19 


В-4.20 


R-4,21 


Ordene as funções a seguir por sua taxa assintótica de crescimento. 


âmlogn+2n 2 B; mum 


Зп + |O0rloga 4m 2" 


2 П 
a? + dn nm nlogn 


Mostre que se din) € CACA), então adin é O(A), então adin) é КДА), 
para qualquer constante a > U, 

Mostre que se din) é fin) e eim é Сп). então o produto dimein é 
Ch mem). 

Forneça uma caracterização O em termos de a do tempo de execução do 
metodo Ex1 apresentado no Trecho de código 4.5. 

Forneça uma caracterização em termos de n do tempo de execução do mé- 
todo Ex? apresentado no Trecho de código 4.5. 

Forneça uma caracterização em termos de a do tempo de execução do mé- 
todo Ex3 apresentado no Trecho de código 4.5. 

Forneça uma caracterização em termos de n do tempo de execução do mé- 
todo Ex4 apresentado no Trecho de código 4.5. 

Forneça uma caracterização em termos de 4 do tempo de execução do më- 
todo Ex5 apresentado no Trecho de código 4.5. 

Bill dispõe de um algoritmo, find2D, para encontrar um elemento x em um 
штап A n X re. O algoritmo find2D itera sobre s linhas de A e chama o al- 
goritmo arrayFind, do Trecho de código 4,4, para cada linha, até que x seja 
encontrado ou todas as linhas de A tenham sido pesquisadas. Qual o tempo 
para o pior caso de find2D em termos de n? Qual o tempo para o pior caso 
de find2D em termos de A, onde N é o tamanho total de A? E correto dizer 
que find2D é um algoritmo de tempo linear? Por que sim ou por que não? 
Para cada função fer e tempo da tabela a seguir, determine o maior tamanho 
de a para um problema Р que pode ser resolvido em tempo r se o algoritme 
para resolver P consome An) microssegundos (uma das entradas já foi feita). 


mel — | — БЕШ ШШ 


4 
nº 
ju 


Mostre que se din) é Oni e ein) é ON guri, então dim) + eim é fin) + 
gi rto. 


Mostre que se din) é Mini) e ein) é Men}, então din) — ein) ndo é 
necessariamente EN fin) — gun). 


Mostre que se din) é Aa e fin) é Gigin, então din) é Ol). 
Mostre que CAMax [om gin = Otfin) + ein). 
Mostre que se fin) É Oig(m se e somente se gin é EMA). 
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R-4.27 Mostre que se pin) é polinomial em relação a n, então log pin) é Сор m). 
R-4.28 Mostre que (n + 1) é Om’). 


Algoritmo Ex1(A): 
Entrada: um arranjo À que armazena m = | elementos 
Saida: a soma dos elementos de A. 
s — A[0] 
рага і + | atén — 1 faça 
#45 + Ali 
retorna 5 
Algoritmo Ex2L4): 
Entrada: um arranjo À que armazena m = | elementos 
Saida: a soma dos elementos das células impares de A. 
х AJO] 
рага і + 2 até n — | em incrementos de 2 faça 
ses + Ajil 
retorna s 
Algoritmo Ex3(A): 
Entrada: um arranjo A que armazena т = | elementos 
Saída: a soma dos da soma dos prefixos de А. 
se 0 
рага i + Daten — | faça 
se s + А[0] 
para у + | até г faça 
s 4— s + Ali] 
retorna s 
Algoritmo Ex4(A): 
Entrada: um arranjo À que armazena m = | elementos 
Salda: a soma da soma dos prefixos de A, 
se AJO] 
tes 
para i | atén — | faça 
ses + Ali] 
fel +5 
retorna t 
Algoritmo Ex5(A.R): 
Entrada: Arranjos A e B cada um armazenando n = | elementos 
Saida: a quantidade de elementos de B iguais à soma da soma dos prefixos de A. 
є+—{} 
рага i + 1 atén — 1 faça 
sl 
para / l atén — | faça 
se—s + A[U] 
para & — | até j Taça 
ss + Al] 
se Bi] = s então 
cec+ 
retorna c 


Trecho de código 4.5 Alguns algoritmos. 
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R-4.35 


R-4.36 


R-4.37 


R-4.38 


Mostre que 2° é O2, 
Mostre que m é Ole log nm). 

Ч E 
Mostre que nm é (я log m. 
Mostre que т log n é £n). 
Mostre que [on mile CA, se fin) é uma função positiva não decrescente 
que é sempre maior que 1. 
O algoritmo A executa uma computação em tempo Otlog n} para cada en- 
trada de um arranjo de n elementos. Qual o pior caso em relação ao tempo 
de execução de A? 
Dado um arranjo X de n elementos, o algoritmo Я escolhe log à elementos 
de x, aleatoriamente, e executa um cálculo em tempo Or) para cada um, 
Qual o pror caso em relação ao tempo de execução de Н? 


Dado um arranjo X de n elementos inteiros, o algoritmo C executa uma 
computação em tempo Ойт) para cada número par de X e uma computação 
em tempo (log n) para cada elemento impar de X, Qual o melhor caso e o 
pior caso em relação ao tempo de execução de C? 

Dado um arranjo X de n elementos, o algoritmo O chama o algoritmo E 
para cada elemento X|i]. O algoritmo É executa em tempo Or) quando é 
chamado sobre um elemento Xi). Qual o pior caso em relação ao tempo de 
execução do algoritmo ГУ? 

Ale Bob estão discutindo sobre seus algoritmos. Al afirma que seu método 
de tempo Cin log n) é sempre mais rápido que o método de Bob de tempo 
Hm}. Para decidir а questão, eles executaram um conjunto de experimen- 
tos. Para o espanto de Al, eles encontraram que se n < 100, o algoritmo 
On”) executa mais rápido, e somente quando a = 100 é que o algoritmo 
Ee log n) é um pouco melhor. Explique como isso é possível. 


Criatividade 


C-4.] 


C-4.2 


4.3 


Cold 


C-4.5 
C-4.6 


C-4.7 


Descreva um algoritmo recursivo para calcular a parte inteira do logaritmo 
de base 2 de n usando apenas somas e divisões meiras, 
Descreva como implementar um TAD fila usando duas pilhas. Qual o tem- 
po de execução dos métodos enqueuel ) e dequeue( | neste caso? 
Suponha que seja fornecido um arranjo A de n elementos contendo inteiros 
distintos que são listados em ordem crescente. Dado um número k, descre- 
va um algoritmo recursivo para encontrar dois inteiros em A cuja soma seja 
k, se tal par existir. Qual o tempo de execução do seu algoritmo? 
Dado um arranjo A de n elementos inteiros não ordenado e um inteiro £, 
descreva um algoritmo recursivo para reorganizar os elementos de A de ma- 
neira que os elementos menores ou iguais a & antecedam qualquer elemento 
maior que & Qual é o tempo de execução do seu algoritmo? 

"mod, | 
Mostre que Zil € O(n ). 

Hoc fi =! ^ E - - 
Mostre que 2.1/2 <2 (Dica: tente limitar esta soma, termo a termo, 
usando uma progressão geométrica). 


Mostre que é log, fin) é log fry se b > 1 é uma constante. 


(C-4.8 


C-4.9 


C-4.10 


CA.11 


C-.12 


C-4.13 


C-4.14 


C-4.15 


C-4.16 


C-4.17 
C-4.18 


C-4.19 
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Descreva um método para encontrar tanto o mínimo como o máximo entre 
n números usando menos que 32/7 comparações. (Dica: primeiro crie um 
grupo de candidatos a mínimo e um grupo de candidatos a máximo). 

Bob construiu um site Web e forneceu a URL apenas para os seus n amigos, 
que ele numerou de | an. Ele disse ao amigo número i que ele pode visitar 
o site no máximo г vezes, Agora Bob tem um contador, C, que mantém o to- 
tal de visitas ao site (mas não as identidades dos visitantes). Qual é o valor 
mínimo de C tal que Bob possa ficar sabendo que um de seus amigos está 
visitando o site mais do que o número permitido de vezes? 

Considere a seguinte “justificativa” рага o fato da função Fibonacci, Fin), 
(veja a Proposição 4.20) ser (Mn): 

Caso Base (n = Ду Fili=leFili=2: 

Passe de indução (n > 2}: Assume-se a afirmação como verdadeira para н 
= n. Considere n. Fin) = Fin — 14+Fin — 2). Por indução, Fin — 1) é Oin* 
— We Fin — 2)€ Oin — 2). Então Fin) é O((n — 1) + {n — 29), pela iden- 
tidade apresentada no Exercício R-4,22, Conseqüentemente, Fin) é On). 
O que está errado nesta justificativa? 

Seja pix) uma polinomial de grau m, isto É, Eod. 

(a) Descreva um método simples de tempo On’) para calcular pi). 

(b) Agora considere re-escrever pix) como 


p 2 a, + xa, + de, + vla, + + ada, + ra) e=}, 


= 


o que é conhecido como método de Horner. Usando a notação O, caracte- 
пе a quantidade de operações aritméticas que este método executa. 
Considere a função Fibonacci, Fin) (veja Proposição 4.20). Mostre por in- 
dução que Fin) é £$4(3/2)'). 

Dado um conjunto À = {ap d... . а, de n inteiros, descreva em pseudocódi- 
zo um método eficiente para calcular cada uma das somas parciais 5, = У а, 
para k = 1, 2,..., n. Qual o tempo de execução deste método? 

Desenhe uma justificativa visual para a Proposição 4.3 análoga a da Figura 
4. L(b) para o caso onde n é impar. 

Um arranjo A contém m — 1 inteiros únicos no intervalo [0, n — 1]. isto é. 
existe um número neste arranjo que nào está em A, Projete um algoritmo de 
tempo On) para encontrar este número. Pode-se usar somente CM 1) espaço 
adicional além do arranjo À propriamente dito. 


Seja 5 um conjunto dem linha no plano tal que não existem duas paralelas 
a nào existe um trio que se encontre no mesmo ponto, Mostre, por indoção, 
que as linhas de 5 determinam Gir ) pontos de intersecção. 

Mostre que o somatório У" Пов, #1 On log n). 


Um rei malvado tem n garrafas de vinho e um espião envenenou apenas 
uma delas. Infelizmente ele não sabe qual. O veneno é extremamente mor- 
tal: apenas uma gota diluida em um bilhão amda mata. Mesmo assim, leva 
um més para o veneno fazer efeito, Desenhe um esquema para determinar 
exatamente qual das garrafas de vinho foi envenenada, em apenas um més, 
usando apenas log m) testadores. 


Suponha que cada linha de um arranjo A, п X m, consiste de zeros e uns 
tais que, em qualquer linha de A, todos os uns antecedem todos os zeros. 
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Assumindo que A ainda está na memória, descreva um método que rode em 

^" a p E 
tempo On) (nào (Жарага encontrar a linha de A que tem o maior núme- 
ro de uns. 


€ 420 Descreva em pseudocódigo um método para multiplicar uma matriz. An X 
n € uma matriz Bm X p. Lembre que o produto C = AB é definido como 
C[i][j] = EZAKI] БЕП]. Qual o tempo de execução de seu método? 

C-42] Suponha que cada linha de um arranjo A, п X n, consiste em zeros e uns 
tais que, em qualquer linha de A, todos os uns antecedem todos os zeros. 
Também suponha que o nümero de uns na linha i é pelo menos o nümero 
na linha é + 1, para; = 0,L,..., m — 2. Assumindo que À está na memória, 
descreva um método que execute em tempo Orr) (não nj} para contar o 
número de uns em A 


C-122 Descreva um método recursivo para calcular o a-ésimo número harmóni- 


co, Н - $^ Mi 


Projetos 


Р-4.1 Implemente prefixAverages! e prefixAveragesz, da Seção 4.2.5, e execu- 
te uma análise experimental dos seus tempos de execução. Visualize seus 
tempos de execução como uma função do tamanho da entrada usando um 
gráfico di-log. 

P-4.2 Execute uma análise experimental cuidadosa que compare os tempos rela- 
tivos de execução dos métodos apresentados no Trecho de código 4.5. 


Observações sobre o capítulo 


A notação O tem gerado vários comentários sobre seu uso [16, 47, 61]. Knuth [62,61] a define 
usando a notação fa) = СА асту). mas diz que esta igualdade funciona apenas em um sentido. Foi 
escolhida uma visão mais tradicional de igualdade e considerou-se a notação O como um conjun- 
to, seguindo Brassard [16]. O leitor interessado em estudar análise do caso médio pode procurar 
o capítulo do livro de Vitter e Flajolet [97]. A história de Arquimedes é encontrada em [77]. Para 
algumas ferramentas matemáticas adicionais, consulte o Apêndice A. 
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5.1 Pilhas 

Uma pilha é uma coleção de objetos que são inseridos e retirados de acordo com o princípio de 
que o último que entra é o primeiro que sai (LIFO*). É possível inserir objetos em uma pilha 
a qualquer momento, mas somente o objeto inserido mais recentemente (ou seja, o último que 
“entrou”) pode ser removido a qualquer momento. O nome “pilha” deriva-se da metáfora de uma 
pilha de pratos em uma cantina. Neste caso, as operações fundamentais envolvem a colocação e 
retirada de pratos da pilha, Quando um novo prato se faz necessário, retira-se o prato do topo da 
pilha (pop) e quando se acrescenta um prato, este é colocado sobre os já empilhados (push), pas- 
sando a ser o novo topo**, Talvez uma metáfora mais divertida pudesse ser uma máquina PEZ? 
fornecedora de doces: estas máquinas guardam doces empilhados sobre uma mola, que oferece o 
doce no topo da pilha quando a tampa da máquina é erguida (ver Figura 5.1). As pilhas são uma 
estrutura de dados fundamental: elas são usadas em muitas aplicações, incluindo as seguintes. 


Figura 5.1 Esquema de um dispensador PEZ^: uma implementação física do ТАР pilha. (PEZ? 
é uma marca registrada da PEZ Candy Inc). 


Exemplo 5.1 Navegadores para a Internet armazenam os endereços mais recentemente visi- 
tados em uma pilha. Cada vez que o navegador visita um novo site, o endereço do site é arma- 
zenado na pilha de endereços. O navegador permite que o usuário retorne a site previamente 
visitados ("pop") usando o Бодо "back". 


Exemplo 5.2 Editores de texto geralmente oferecem um mecanismo de reversão de operações 
( "undo") que cancela operações recentes e reverte um documento a estados anteriores. À opera- 
ção de reversão é implementado mantendo-se as alterações no texto em uma pilha. 


5.1.1 Otipo abstrato de dados pilha 


Pilhas são as mais simples de todas as estruturas de dados, apesar de estar entre uma das mais 
importantes, na medida em que são usadas em uma gama de aplicações diferentes que incluem 


* N, de T. Em inglés, last-in, first-aut, 
**M.de T. Em inglés, estas operações de colocação e retirada de uma pilha são chamadas de push e pop, respectivamente, e esta 
nomenclatura será mantida neste livro, 
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estruturas de dados muito mais sofisticadas. Formalmente, uma pilha 5 é um tipo abstrato de 
dados (TAD) que suporta os dois métodos que seguem: 
push(eX Insere o objeto e no topo da pilha. 
popii: Remove o elemento no topo da pilha e o retorna; ocorre um erro se à 
pilha estiver vazia. 
Adicionalmente, podem-se definir os seguintes métodos: 
size): Retorna o número de elementos na pilha. 
isEmpty(): Retorna um booleano indicando se a pilha está vazia. 
top): Retorna o elemento no topo da pilha, sem retirá-lo, ocorre um erro se a 
pilha estiver vazia. 


Exemplo 5.3 A rabela a seguir mostra uma série de operações de pilha e seus efeitos sobre 
uma pilla 5 de inteiros, inicialmente vazia 


Operação Conteúdo da pilha 
push(5) 
push(3) 
popi} 
push(7) 
рор) 
topi) 
рор} : 
papi “error” 
isEmptyi} rue 
push(5) - 
push(7) - 
push(3) - 
push(5) 
size) 
popi) 
| push(8) 
| popi 
popi} 


Uma interface para pilhas em Java 


Por sua importância, a estrutura de dados pilha é uma classe “embutida” no pacote java.util de 
Java. A classe java.util.Stack é uma estrutura de dados que armazena objetos Java genéricos e 
inclui, entre outros, os métodos pushi ), popi |, peek( ) (equivalente a top()), size( ) e empty( ) 
(equivalente a isEmpty( j). Os métodos popi ) e реек ) lançam a exceção EmptyStackException 
se a pilha estiver vazia quando eles forem chamados. Embora seja conveniente usar a classe java, 
util Stack, é instrutivo aprender como projetar e implementar uma pilha desde o início. 

Implementar um tipo abstrato de dados em Java envolve dois passos. O primeiro passo É a 
definição de uma Application Programming Interface (APD ou simplesmente interface que 
descreve os nomes dos métodos que o TAD suporta e como eles são declarados e usados, 

Além disso, devem-se definir exceções para qualquer condição de erro que possa ocorrer. 
Por exemplo, a condição de erro que ocorre quando se chama os métodos pop() ou topl } sobre 
uma pilha vazia é sinalizada pelo lançamento de uma exceção do tipo EmptyStackException, que 
é definida no Trecho de código 5.1. 
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me 
* Excegáo de tempo de execução lançada quando alguém tenta executar uma operação top 
* ou pop sobre uma pilha vazia. 
*j 


public class EmptyStackException extends RuntimeException | 


public EmptyStackException(String err) { 
superar): 
} 


Trecho de código 5.1 Exceção lançada pelos métodos рор) e top ) da interface Stack quando 
ativados sobre uma pilha vazia, 


Uma interface Java completa para o TAD pilha é fornecida no Trecho de código 5.2. Obser- 


va-se que esta interface é bastante geral, pois ela especifica que elementos de quaisquer classes 
(e suas derivadas) podem ser colocados na pilha. Esta generalidade é obtida usando o conceito 
de genéricos (Seção 2.5.2). 


Para que um TAD seja útil, é necessário providenciar uma classe concreta que implemente os 


métodos da interface associada com aquele TAD. Uma implementação simples рага a interface 
Stack é apresentada na próxima subseção. 


f" + 

* Interface para uma pilha: uma coleção de objetos 

+ que são inseridos e removidos de acordo com a principia do último que entra ё o 
+ primeiro que sai. Esta interface inclui os principais métodos de Java util Stack 

4 

+ &author Roberto Tamassia 

* Gauthor Michael Goodrich 

* &see EmptyStackException 

ЫН 


public interface Stack--E-- | 


JFE 
+ Ratorna o número de elementos na pilha 
+ Gretum número de elementos na pilha, 
my 
public int Sizel |; 
PEE 
* Indica quando a pilha está vazia 
* Breturn true se a pilha é vazia, false em caso contrário. 
у 
public boolean isEmptyt |; 
pe 
* Inspeciona o elemento no topo da pilha 
* (return o elemento do topo da pilha. 
* exception EmptyStackException se a pilha estiver vazia. 
*/ 
public E topi | 
throws EmptyStackException; 
par 
* insere um elemento no topo da pilha, 
* @param elemento a ser inserido. 
ui 


Pilhas e Filas 181 


public void push (E elementi; 

paa 
* Remove o elemento do topo da pilha. 
* Greturn elemento a ser removido 
* Dexception EmptyStackException se a pilha estiver vazia. 
nf 
public E popi 

throws EmptyStackException; 
} 


Trecho de código 5.2 Interface Stack documentada com comentários em estilo Javadoc. (Ver 
Seção 1.9.3.) Observe também o uso do tipo genérico parametrizado, E, o que implica que a pilha 
pode conter elementos de qualquer classe. 


5.1.2 Uma implementação baseada em arranjos 


Pode-se implementar uma pilha armazenando-se seus elementos em um arranjo. Mais especifica- 
mente, a pilha desta implementação consiste em um arranjo 5 de М elementos mais uma variável 
inteira + que fornece o indice do elemento горо no arranjo 5. (Ver Figura 5.2.) 


Figura 5.2 Implementação de uma pilha através de um arranjo 5, O elemento do topo de 5 está 
armazenado na célula Sfr]. 


Lembrando que os indices para um arranjo começam no valor U em Java, inicializa-se ў com 
— 1 е usa-se esse valor para identificar quando a pilha está vazia. Da mesma forma, pode-se usar 
esta variável para determinar a quantidade de elementos (t + 1). Introduz-se um novo tipo de ex- 
ceção chamada FullStackException, que sinalizará uma condição de erro ao se tentar inserir um 
novo elemento em um arranjo cheio. À exceção FullStackException é específica para esta imple- 
mentação e não está definida no TAD pilha. Os detalhes desta implementação de pilha baseada 
em arranjo são fornecidos no Trecho de código 5.3. 


Algoritmo size): 
return: +] 
Algoritmo isEmptyl }: 
return ir = О) 
Algoritmo topi |: 
se isEmpty( ) então 
langar uma EmptyStackException 
retorna 5/r] 
Algoritmo pushie): 
se size() = N então 
lançar uma FullStackException 
t= +] 
ali —e 
Algoritmo popi |: 
se isEmpty() então 
lançar uma EmptyStackException 
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e Alt] 
Str] — nulo 
tr] 
retoma e 


Trecho de código 53 Implementação de uma pilha através de um aranjo de tamanho fixo, N, 


Analisando a implementação da pilha baseada em arranjo 


A correção dos métodos da implementação baseada em arranjo resulta imediatamente da 
definição dos próprios métodos. Ainda assim, há um ponto interessante na implementação do 
método pop. 

Observa-se que $e poderia evitar resetar S[7] para nulo e ainda resultaria um método coreto. 
Existe um acordo em se evitar esta atribuição quando se pensa em implementar este algoritmo 
em Java. Este acordo envolve o sistema de coleta de lixo de Java que procura na memória por 
objetos que não estão mais sendo referenctados por objetos ativos, e libera o espaço para uso 
futuro. (Para mais detalhes, ver a Seção 14.1.3) Seja e = S[r] o objeto no topo da pilha antes que 
o método pop seja chamado. Fazendo com que 5[1] seja nulo, indica-se que a pilha não precisa 
mais guardar uma referência ao objeto e. Assim, se não existem outras referências ativas para o 
objeto e, então o espaço de memória ocupado por e será liberado pelo coletor de lixo. 

A Tabela 5.1 apresenta os tempos de execução dos métodos de uma implementação de pilha 
usando arranjo. Na implementação usando arranjo, cada um dos métodos executa uma guanti- 
dade constante de comandos que envolvem operações aritméticas, comparações e atribuições. 
Além disso, pop também chama isEmpty. que também executa em um tempo constante. Logo, 
resta implementação do TAD pilha cada método executa em tempo constante, isto é, executa em 
tempo O dl j. 


[wp foi 


Tabela 5.1 O desempenho de uma pilha implementada com arranjo. O uso de espaço é OU), 
onde N é o número máximo de elementos que à pilha pode conter, determinado quando a pilha é 
instanciada, Observa-se que o espaço é independente do número n = N de elementos que estão 
realmente na pilha. 


Uma implementação concreta em Java da especificação em pseudocódigo do Trecho de có- 
digo 5.3 com a classe ArrayStack, implementando a interface Stack, € mostrada nos Trechos de 
código 5.4 e 5.5. Infelizmente, por questões de espaço, omitiu-se grande parte dos comentários 
“javadocs” deste e da maioria dos demais trechos de código Java apresentados no restante deste 
livro. Observa-se que foi usado um nome simbólico, CAPACITY, para especificar a capacidade 
do arranjo. Esso permite que à capacidade do arranjo seja especificada em um local do código e 
tenha seu valor disponivel em todo código. 
pe 

* Implementação da interface Stack usando um arranjo de tamanho fixo. 
* Uma exceção é lançada ao tentar realizar uma operação de push quando o 
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* tamanho da pilha é igual ao tamanho do arranjo. Esta classe inclui os principais 
* métodos da classe Java pré-definida java.util. Stack. 


ef 


public class ArrayStack<E> implements Stack<E> | 


Trecho de código 5.4 


protected int capacity; —// capacidade real do arranjo da pilha 
public static final int CAPACITY = 1000; // capacidade default do arranjo 
protected Е S[ |; і! Arranjo genérico usado para implementar a pilha 
protected int top = —1; “índice para o topo da pilha 
public ArrayStackí ) [ 

this(CAPACITY); // capacidade default 
} 


public ArrayStack(nt cap) { 
capacity = cap; 
5 = (El || new Object[capacity]; -V о compilador deve gerar um aviso, mas está ok 


| 
public int size() { 
return (top + 1); 


public boolean isEmpty( | [ 
return (lop = 0); 
} 
public void push(E element) throws FullStackException | 
if (size ) == capacity) 
throw new FullStackException(" stack is full." 
S[^ top] = element; 


! 
public Е topi ) throws EmptyStackException | 
if isEmpty( }} 
throw new EmptyStackException("Stack is empty."); 
return S[top]; 
| 
public E popí | throws EmptyStackException { 
E element; 
if (isEmptyt |) 
throw new EmptyStackExceptionj"Stack is empty.") 
element = S[top]; 
S[tap- -] = null; // desreferencia S[top] para o sistema de coleta de lixo 
return element; 


| 


cho de código 5,5.) 


MH 


public String toString( ) ( 


String s; 

з="[" 

if size() > 0) s+= 5{0]; 

if (size( | > 1) 

for (inti = 1; 1<= sizae() 1; it *) 4 
s+=", "+ Sl) 

| 

returns + *]"; 


} 


Imprime informação de estado sobre uma operação recente da pilha 
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Uma implementação em Java para a interface Stack. (Continua no Tre- 
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public void status(String op, Object element) [ 


System.oaut.print(* > "op imprime esta operação 
System.out.printin(", returns " + element); ¿Fo que foi retornado 
System.ouLprim("result: size = " + size +", isEmpty = = + isEmpty( Jy 
oystem.out.printin(", stack: " + this); tt conteúdo da pilha 

] 

rum 


* Testa o programa executando uma série de operações sobre pilhas, 
* imprimindo as operações executadas, 05 elementos retornados e o conteúdo da pilha 
* após cada operação 
*j 
public static void main(String| ] args) ( 
Object o; 
ArrayStack- Integer > À = new ArrayStack-- Integer ={ Y; 
A.status("new ArrayStack-cInteger- А", null; 
A. push? 
A statusi "A. push (7) *, null; 
o = A papi k 
A status "A. popi)", ok 
A pushish 
A status "A. push (54º, null}; 
O = Apopi} 
Astatus(" A. pept)”, Ol; 
ArayStack<String> B = new ArayStack=<String:=( |; 
B.status("new ArrayStackescring> В", null); 
B push" Rob" 
B.status(" E. push {^ "Bob! ”)*, mull 
B. push "А1ісе" |; 
B.status(" B.push (S "Alice! ”)", mull 
o = В.рор |: 
B.status(" B. porii", ok 
B push" Eve"); 
E.status(" B. push ("Eve") ", null; 


Trecho de código 5.5 Pilha baseada em arranjo. (Continuação do Trecho de código 5.4.) 


Exemplo de saída 


A seguir, а saída do programa ArrayStack já visto é apresentada. Observa-se que por meio do uso 
de tipos genéricos é possível criar um ArrayStack A que armazena inteiros e outro ArrayStack B 
que armazena strings. 


------5 new ArrayStackeIntegers À, returns null 
result: size = 0, isEmpty = true, stack: [] 
meren > A.pushi7:, returns null 

regult: size = 1, isEmpty = false, stack: [7] 
------» A.popil, returns 7 

result: size = D, isEmpby = true, stack: |] 
----- -> A pushi%?, returns null 

result: size = 1, isEmpty = false, stack: [9] 
------» A.papil, returns B 

result: size = 0, isEmpty = true, stack: [] 
-------» new Array5stackc«etring» B, returns null 
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result: size = 0, isEmpty = true, stack: [] 
------» B.pushí"Bob"), returns null 
result: size = 1, isEmpty = false, stack: [Bob] 
- > B.pushi"Alice"], returns null 
result: size « 2, isEmpty « false, stack: [Bob, Alice] 
mine > E.popl), returns Alice 
result: size = 1, isEmpty = false, stack: [Boh] 
------= B.pushi"Ewve"), returns null 
result: size = 2, isEmpty = false, stack: [Bob, Eve] 


Um problema com a implementação da pilha baseada em arranjo 


A implementação de uma pilha com arranjos é simples e eficiente, Mesmo assim, esta imple- 
mentação tem um aspecto negativo — ela deve assumir um limite superior fixo, CAPACITY, para 
o tamanho máximo da pilha. No Trecho de código 5.4, escolheu-se o valor 1000 de forma mais 
ou menos arbitrária. Uma aplicação real pode precisar de muito menos espaço e, nesse caso, 
ocorreria desperdicio de memória. Por outro lado, uma aplicação pode precisar de mais espaço 
e, neste caso, a implementação da pilha poderia gerar uma exceção Tão logo o programa cliente 
tente armazenar o objeto 1001 na pilha. Por isso, mesmo com esta simplicidade e eficiência, a 
implementação de pilha baseada em arranjos não é necessariamente a ideal. 

Felizmente, existem outras implementações, discutidas a seguir, que não sofrem limitações 
de tamanho е usam memória proporcionalmente ao número de elementos armazenados na pilha. 
Nos casos em que se tem uma boa estimativa do número de elementos que serão colocados na 
pilha, entretanto, а implementação baseada em arranjos é dificil de superar. As pilhas são uma 
função vital de muitas aplicações, e por isso é muito útil dispor de uma implementação veloz do 
TAD pilha tal como a implementação baseada em arranjos, 


5.1.3 Implementando uma pilha usando uma lista encadeada genérica 


Nesta seção, serão exploradas as listas simplesmente encadeadas para implementar o TAD pilha. 
No projeto de tal implementação, será necessário decidir se o topo da pilha estará localizado na 
cabeça ou na cauda da lista. Entretanto, a melhor escolha é óbvia, uma vez que se pode inserir 
e remover elementos em tempo constante apenas na cabeça. Assim, € mais eficiente ter o topo 
da pilha localizado na cabeça da lista. Além disso, de maneira a executar à operação size em um 
tempo constante, manter-se-ã o número corrente de elementos em uma variável de instância. 

Em vez de se usar uma lista encadeada que armazena apenas um tipo de objeto, como mos- 
trado па Seção 3,2, optou-se neste caso, por implementar uma pilha genérica usando uma lista 
encadeada genérica. Assim, se faz necessário usar um tipo genérico de nodo para implementar 
esta lista encadeada. Apresenta-se tal classe Node no Trecho de código 5.6. 


public class Node<E= | 
i Variáveis de instância 
private E element; 
private Node<E> next; 
/** Cria um nodo com referencias nulas рага os seus elementos e o próximo nodo */ 
public Made ) 1 
thisinull, null); 
] 


/** Cria um nado com um dado elemento e a próximo nado */ 
public Mode(E e, Node<E> n) { 

element = e; 

next = п; 
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/! Métodos de acesso: 
public E getElementí ) i 
return element; 


} 
public Node<E> getNexti ) { 
return next ; 


} 

di Metodos modificadores: 

public void setElementE newElem) { 
element = newElem; 

| 

public void setHext[Node<E= newMext) { 
next = newNext; 

| 

| 


Trecho de código 5.6 Classe Node. que implementa um nodo genérico para uma lista simples- 
mente encadeada. 


A classe genérica NodeStack 


Uma implementação Java de uma pilha, usando uma lista simplesmente encadeada genérica é 
fornecida no Trecho de código 5.7. Todos os métodos da interface Stack são executados em tem- 
po constante. Além de ser eficiente em relação ao tempo, esta implementação de lista encadeada 
tem uma necessidade de memória que é Om, onde n é o número de elementos na pilha. Assim, 
esta implementação não requer que uma nova exceção seja criada para lidar com o problema de 
estouro do tamanho. Usa-se uma variável de instância, top, para referenciar a cabeça da lista (que 
irá apontar para o objeto null se a lista estiver vazia). Quando se insere um novo elemento e na 
pilha, simplesmente cria-se um novo nodo v para e, referencia-se e a partir de v, e instre-se v na 
cabeça da lista. Da mesma forma, quando se retira um elemento da pilha, simplesmente remove- 
se o nodo da cabeça da lista e retoma-se seu elemento. Assim. executam-se todas as insergöes е 
remuções de elementos na cabeça da lista. 


public class NodeStack< E = implements Stack<E> [ 


protected Node=E= top; referencia para a nodo cabeça 
protected int size; '/quantidade de elementos na pilha 
public NodeStack( | [//constrói uma pilha vazia 

top = null; 

size = 0; 


public int size( ) | return size; } 
public boolean isEmptyl ) { 
if (top == null) return true; 


return false; 
} 
public void pushiE elem) { 
Mode-E- v = new Node<=E=(elem, top); Meria e encadeia um nodo novo 
top =ч; 
Size++; 
} 


public E topi ) throws EmptyStackException | 
if isEmpty( jj throw new EmptyStackException(" stack is empty."k 
return top.getElement( |; 

) 

public Е pop ) throws EmptyStackException { 


Trecho de código 5.7 


9.1.4 
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if (isEmpty( )) throw new EmptyStackException("Stack is empty. "i 


E temp = top.getElement( ); 
top = top.getMexti |; 

size =; 

return temp; 


Invertendo um arranjo usando uma pilha 


¿esencadela o nodo topo 
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Classe NodeStack que implementa a interface Stack usando uma lista 
simplesmente encadeada cujos nodos sio objetos da classe Node, do Trecho de código 5.6. 


Pode-se usar uma pilha para inverter os elementos de um arranjo através da geração de um algorit- 
mo não-recursivo para o problema da inversão de um arranjo introduzido na Seção 3.5.1. A idéia 
básica consiste em inserir todos os elementos do arranjo em ordem na pilha. O Trecho de código 5.8 
fomece uma implementação Java deste algoritmo, Por acaso, este método demonstra também como 
se podem usar tipos genéricos em uma aplicação simples que usa uma pilha genérica. Em especial, 
quando os elementos são retirados da pilha neste exemplo, eles são automaticamente retornados 
como elementos do tipo E; consequentemente, eles podem ser imediatamente retornados para o 


arranjo de entrada. Apresenta-se um exemplo de uso deste método no Trecho de código 5.9. 


/** Um método genérico não recursivo para inverter um arranjo */ 
public static =E = void reverse(E| | a) | 


Stack<E> 5 = new ArrayStack «E (a length): 
for (int i=0; i = a length; i++) 

S.push(ali]); 
for (int i—0; i| = a.length; i++) 

а] = S.pop( }; 


Trecho de código 5.8 Um método genérico que inverte os elementos do arranjo de tipo E usan- 


do uma pilha declarada através da interface Stack<E>. 


2% Rotina de teste para a inversão de arranjo */ 
public static void main(String args! |) { 


Integer] ] a = (4, B, 15, 16, 23, 421; /f o autaboxing permite isso 


| JString[] 5 = ("Jack", "Kate", "Hurley", "Jin", "Boone"} 


System.out.printin("a = " + Arrays.toString(al). 
System.out.printin"s = " + Arrays.toStringis)); 
System.out.println("Reversing. . ."k 
reverse(a); 

reverse(s); 


System.out.printin(ra = * + Arrays.toString(a)): 


System.out.printin("s = " + Arrays.toString(s)); 


A saída do método é a seguinte: 


а = [4, B, 15, 15, 23, 42] 

a = [Jfack, Kate, Hurley, Jin, Michael] 
Reversind... 

á = [42, 23, 16, 15, B, 4] 

B - [Michael, Jin, Hurley, Kate, Jack] 


Trecho de código 5.9 Teste do método de inversão usando dois arranjos. 
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5.1.5 Verificando parênteses e tags HTML 


Nesta subseção exploram-se duas aplicações relacionadas com pilhas, sendo que a primeira lida 
com verificação de parênteses e o agrupamento de símbolos em expressões aritméticas. 
As expressões aritméticas podem conter vários pares de símbolos agrupados, tais como 


Parénteses: "(e р 

Chaves: "(^e "]" 

Colchetes: "[" e *]" 

Símbolos de truncamento: "|" e " 

Símbolos de arredondamento por excesso: ra 


e para cada símbolo de abertura deve corresponder um símbolo de fechamento, Por exemplo, um 
abre colchetes "|", deve corresponder à um fecha colchetes "|", como na expressão que segue: 


[65 + x) — (y + zj]. 
Os exemplos a seguir ilustram esse conceito: 


Correto: ( X( IMC HI} 
Correto: (UC KCOMCODnin 
Incorreto: xt fic op] 
Incorreto: (E[ ])] 

+ Incorreto: (. 


Deixa-se a definição mais precisa da verificação de agrupamento de simbolos para o Exer- 
cicio R-5.5. 


Um algoritmo para verificação de parênteses 


Um problema importante no processamento de expressões aritméticas é ter certeza que os grupos 
de simbolos estão casados corretamente. Pode-se usar uma pilha 5 para executar a verificação de 
grupos de simbolos em expressões aritméticas com uma varredura simples da esquerda para di- 
reita, O algoritmo testa se os símbolos de abertura e fechamento casam e se são do mesmo tipo. 

supondo uma segiiéncia X = x,x, x... . x, ,, onde cada x, é um teken que pode ser um con- 
junto de símbolos, um nome de varıävel, um operador aritmético ou um número. A idéia básica 
por trás da verificação de que os símbolos em 5 casam corretamente é processar os tokens de X 
em ordem. Cada vez que se encontra um símbolo de abertura insere-se o símbolo na pilha e cada 
vez que se encontra um simbolo de fechamento retira-se o simbolo do topo da pilha 5 (assumin- 
do-se que a pilha não está vazia) e verifica-se se os dois são do mesmo tipo. Se a pilha estiver 
vazia após ter sido processada toda à sequência, então os símbolos em X casam, Assumindo que 
as operações push e pop são implementadas para executar em tempo constante, este algoritmo 
executa em tempo (я) que é linear. O Fragmento de código 5,10 apresenta a descrição em pseu- 
docódigo deste algoritmo. 


Algoritmo ParenMatch( X, 41): 
Entrada: Um arranjo X de n tokens, cada um dos quais é um grupo de símbolos, uma variá- 
vel, um operador aritmético ou um número, 
Saida: true se e somente se todos os grupos de símbolos de X casam corretamente 
Seja 5 uma pilha vazia 
para i + О até n— 1 faça 
se Xi) é um símbolo de abertura então 
5.pushi ХЕ 
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sendo se ATi] é um símbolo de fechamento então 
se S.isEmptyt ) então 


retorna false [nada para casar] 
se $ pop( ) não casa com o tipo de X[7] então 
retorna false [tipo errado] 


se S.isEmptyí ) então 

retorna trut [todos os símbolos casam і 
senão 

retorna false [alguns simbolos não casam] 


Trecho de código 5.10 Algoritmo para verificar o agrupamento de simbolos em expressões 
aritméticas. 


Verificando tags em um documento HTML 


Outra aplicação na qual a verificação de agrupamento é importante é na validação de documen- 
tos HTML. HTML é um formato padrão para hiperdocumentos na Internet. Em um documento 
HTML, porções de texto são delimitadas por tags HTML. Uma tag de abertura simples tem a for- 
ma “<nome="e a tag de fechamento correspondente tem a forma “<=/nome=". As tags HTML 
mais usadas incluem 


* body: o corpo do documento 
ht: seção de cabeçalho 
center: texto centralizado 

p: parágrafo 

ol: lista numerada (ordenada) 
li: item de lista 


No caso ideal, todas as tags de um documento HTML devem casar, embora alguns navega- 
dores tolerem algumas tags que não casam. 

A Figura 5.3 apresenta um exemplo de documento HTML e uma possibilidade de execução 
рага © Mesmo, 


«Бойу 

Centers 

«hi» The Little Boat </hls The Little Boat 
</center> 

<p> The storm tossed the little The storm tossed the little boat 
boat like a cheap sneaker in an like a cheap sneaker in an old 


old washing machine. The three 
drunken fishermen were used to 
such treatment, of courge, but 
noc the tree salesman, who even as 


washing machine. The three 
drunken shermen were used to 
such treatment, of course, but not 


a stowaway now felt that he the tree salesman, who even as 
had overpaid for the voyage. </p> a stowaway now felt that he had 
«als overpaid for the voyage. 

<li> Will the salesman die? «/li» 1. Will the salesman die? 
<li> What color is che boat? 4/11 2. What color is the boat? 
UEM what about Naomi? «/li» 3. And what about Naomi? 


"bad 
AIR (a) (b) 


Figura 5.3 Demonstrando tags HTML. (a) um documento HTML; (b) sua execução. 
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Felizmente, mais ou menos o mesmo algoritmo do Trecho de código 5.10 pode ser usado 
para verificar as tags de um documento HTML. Nos Trechos de código 5,11 е 5.12, € fornecido 
o programa Java que verifica tags em um documento HTML lido a partir da entrada padrão. Por 
simplicidade, assume-se que todas as tags são simples, de abertura ou fechamento, definidas 
anteriormente e que nenhuma tag está mal formada. 
import java.io.*; 
import java. util. Scanner; 
import net.datastructures. *; 

/** Verificação simplificada de tags em um arquivo HTML */ 
public class HTML ( 
/** Retira o primeiro e o último caracter de uma <tag> string */ 
public static String stripEndsiString t) | 
if Лепо у == 2) return null; “festa е uma tag degenerada 
return t.substringrt.tlength() = 1); 
| 
/** Testa se uma <tag> string retirada é vazia ou é uma tag de abertura verdadeira */ 
public static boolean isOpeningTag(String tag) { 
return (tag length) == 0) | | (tag.charAt(U) fm '/ 7); 


| 


Trecho de código 5.11 Um programa Java completo para verificar as tags de um documento 
HTML. (Continua no Trecho de código 5.12) 


/** Testa se a tagi casa com a tag? de fechamento (o primeiro caracter é um '/) */ 
public static boolean areMatchingTags(String tagi, String tag2) ( 
return tag 1 edqualsitagz substring(1)) // test against name after '” 
| 
£* Testa se toda tag de abertura tem uma tag de fechamento "/ 
public static boolean isHTMLMatchediíString[ | tag) { 
Stack--String-- 5 = new NodeStack= String =() // Pliha para verificar tags 
for (int i = 0; (i < tag length) 84 (tag[i] != null); ++) ( 


if isOpeningTagitagfi])) 
s.pushitagf]); // tag de abertura; coloca-o de volta na pilha, 
else [ 
if (S.isEmptyt ) 
return false: if nada para casar 
if ('areMatching Tags(S.pop(), tag]i[l) 
return false; N casamento errado 


} 
if (S.isEmptyí | return true; // tudo casa 
return false; // algumas tags não casam 


i 
public final static int CAPACITY = 1000; // Tamanho do arranjo de tags 
/* Transtorma um documento HTML em um arranjo de tags HTML */ 
public static String[ ] parseHTML(Scanner s) { 
String[ ] tag = new String[ CAPACITY]; // o arranjo de tags (inicialmente todas nulas) 
int count = 0; // contador de tags 
String token; fi token retomado pelo scanner s 
while (s hasMextLine( 1) 4 
while {foken = s.findlnLine(" < [^+] *-7)) l= null) // encontra a próxima tag 
tag[count-- +] = stripEndsitoken); 4 retira o fim desta tag 
s.nextLine |; vai рага a próxima linha 
і 
return tag; //o arranjo de tags (retiradas) 
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} 
public static void main(String[ ] args) throws IOException ( // testador 
if (ieHTMLMatched(parseHTML(new Scanner(System.in)l)) 
System.outprintin("The input file is a matched HTML document.") 
else 
Systom.out.printin("The input file is not a matched HTML document." 
} 


] 


Trecho de código 5.12 Programa Java para testar o casamento de tags em um documento 
HTML. (Continuação do Trecho de código 5.11.) О método isHTMLMatched usa uma pilha para 
armazenar os nomes das tags de abertura, vistas anteriormente, de maneira semelhante ao que 
foi usado no Trecho de código 5.10. O método parseHTML usa um Scanner s para extrair as tags 
do documento HTML usando o padrão "<< [^2 |+", que denota uma string que começa por "<<" 
seguida por zero ou mais caracteres que não são ">", seguidos por um >, 


5.2  Filas 


Outra estrutura de dados fundamental é a fila. Ela é uma “prima” próxima da pilha, pois uma 
fila é uma coleção de objetos que são inseridos е removidos de acordo com o principio de que 
“o primeiro que entra é o primeiro que sal” (FIFO*), Isto €, os elementos podem ser inseridos 
a qualquer momento, mas somente o elemento que está na fila há mais tempo pode ser retirado 
em um dado momento. 

Geralmente, diz-se que os elementos entram na fila por trás e saem da fila pela frente. A 
metáfora para esta terminologia é uma fila de pessoas esperando para andar em um brinquedo 
de parque de diversões, As pessoas esperando para andar juntam-se à fila por trás e conseguem 
andar quando estão na frente, 


5.2.1 O tipo abstrato de dados fila 


Formalmente, o tipo abstrato de dados fila define uma coleção que mantém objetos em uma se- 

quiência, na qual o acesso aos elementos e sua remoção são restritos ao primeiro elemento da se- 

giiéncia, que é chamado de início da fila e a inserção de elementos é restrita ao fim da sequência, 

que é chamada de fim da fila. Essa restrição garante a regra de que se inserem e se deletam itens 

em uma fila de acordo com o princípio de que o primeiro que entra é o primeiro que sai (FIFO). 
O tipo abstrato de dados file suporta os dois métodos fundamentais que seguem: 


enqueue(o): Insere o elemento e no fim da fila. 
dequeue(): Retira e retorna o objeto da frente da fila. Ocorre um erro se a fila esti- 
ver Vazia, 
Adicionalmente, de forma semelhante ao tipo abstrato de dados Stack, o TAD fila inclui os se- 
guintes métodos auxiliares: 
size(): Retoma o número de objetos na fila. 
isEmpty(): Retorna um booleano indicando se a fila está vazia, 


Fonti): Retoma, mas não remove, o objeto na frente da fila, Ocorre um erro se 
a fila estiver vazia. 


* N. de T. First in, first ont, em inglés. 
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Exemplo 5.4 A tabela a seguir mostra uma série de operações e seus efeitos sobre uma fila Q, 
inicialmente vazia, de objetos inteiros. Pora simplificar, serão usados inteiras em vez de objetos 
inieirox como argumentos das operações. 


enqueue(5) 
anquaeue(3) 


frente «— Q — fim i 


dequeuel) 
enqueue(7) 
| dequeuei) 
| тогі) 
йециеша{} 
dequeue() ü 
igEmptyl) {) 
enqueue(9) (9) 
anqueue(7) (9.7) 
size() (9,7) 
enqueue(3) (9,7.3) 
enqueue(5) (9,7,3,5) 
dequauei) (7.3,8) 


Aplicações exemplo 


Existem várias possibilidades de aplicações para filas. Lojas, teatros, centrais de reserva e outros 
serviços similares normalmente processam as requisições dos clientes de acordo com o princípio 
FIFO. Uma fila pode, consequentemente, ser a escolha lógica para а estrutura de dados que trata o 
processamento de transações de tais aplicações. Por exemplo, pode ser a escolha natural para tratar 
as chamadas de uma central de reservas de uma companhia aérea ou da bilheteria de um cinema, 


Uma interface de fila em Java 


Uma interface em Java para o TAD fila é fornecida no Trecho de código 5.13. Esta interface ge- 
nénica especifica que objetos de classes arbitrárias podem ser inseridos na fila, Assim, não existe 
a necessidade de se usar coerção explícita quando da retirada de elementos. 

Observa-se que os métodos size e isEmpty têm o mesmo significado que seus equivalentes 
no TÃO pilha, Estes dois métodos, hem como o método front, são conhecidos como métodos de 
acesso, pois retornam um valor e não alteram o conteúdo da estrutura de dados. 


public interface Queve Е [ 
"LL 
* Retoma o número de elementos na fila. 
= return número de elementos na fila. 
ef 
public int size |; 
Per 
* Retoma se a fila está varia. 
* return true se a fila estiver vazia, false em caso contrário. 
ef 
public boolean isEmpty x 
fk 


= Inspeciona o elemento а frente da fila. 


5.2.2 


* Breturn o elemento à frente da fila. 
* &exception EmptyQueueException se a fila estiver vazia 
public E fronti ) throws EmptyQueueException: 


per 
* Insere elemento no final da fila. 
+ @param element, o novo elemento a ser inserido 
ЫЈ 


public void enqueue (Е element); 
PES 


* Remove o elemento à frente da fila. 

* Breturn elemento à frente da fila. 

* Bexception EmptyQueueException se a fila estiver vazia, 
ny 

public E dequeve( | throws EmptyQueueExceptian; 


Trecho de código 5,13 Interface Queue documentada com comentários em estilo Javadoc, 


Uma implementação simples baseada em arranjos 


Nesta subseção, será apresentado como implementar uma fila usando um arranjo O de tamanho 
fixo para armazenar seus elementos. Já que a regra principal com o tipo abstrato de dados fila 
é que os elementos são insendos e deletados de acordo com o princípio FIFO, deve-se decidir 
como manter o controle da frente e do fim da fila. 

Uma possibilidade seria adaptar a abordagem usada para a implementação da pilha, fazendo 
com que Q[O] seja a frente da fila e deixando a fila crescer a partir даў, Entretanto, esta não é 
uma solução eficiente porque exige que se movam todos os elementos para a frente uma posição, 
a cada vez que se efetuar uma operação dequeve, Uma implementação assim requereria tempo 
Cn) para executar o método dequeve, onde n é o número corrente de objetos na fila, Se for dese- 
jável tempo constante para cada método da fila, será necessária uma abordagem diferente, 


Usando um arranjo de maneira circular 


Para evitar mover objetos uma vez que eles tenham sido colocados em O. definem-se duas variá- 
veis fe r que possuem os seguintes significados: 


e féum indice de uma célula de Q que guarda o primeiro elemento da fila (que é o próximo 
candidato à remoção no caso de uma operação dequeue), a não ser que a fila esteja vazia 
(e neste caso f — г). 

è réum indice para a próxima posição livre em Q. 


Inicialmente, atribui-se f = r = O, indicando que a fila está vazia. Quando se remove um ele- 
mento da frente da fila, incrementa-se para indicar a próxima célula. Da mesma forma, quando 
se acrescenta um elemento, armazena-se o mesmo em Ofr] e incrementa-se r para indicar a próxi- 
ma célula livre em 2. Esse esquema permite implementar os métodos front, enqueue e dequeue 
em tempo constante, isto €, Ol). Entretanto, ainda existe um problema com esta abordagem. 

Considere-se, por exemplo. o que acontece se um mesmo elemento for inserido e retirado 
N vezes, Neste caso, tem-se f — r = М, An se tentar inserir o elemento apenas mais uma vez, irá 
ocorrer um erro de indice fora de faixa (pois as N posições válidas de Q vão de Q[0] a Q[N— 1), 
mesmo que, neste caso, haja bastante espaço na fila. Para evitar este problema e poder utilizar todo 
o arcanjo Q, faz-se com que os indices f e r “façam a volta” ao final de Q. Isto é, entende-se Q como 
um “arranjo circular” que vai de Q[O] a Q[N— 1] e recomeça em QIO] outra vez. (Ver Figura 5.4.) 
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о n1 2 f П N-I 
(a) 

ü 1 2 Р f N-I 
(b) 


Figura 5.4 Usando o arranjo Q de forma circular: (a) a configuração “normal” com f = г; (b) a 
configuração "reversa" com г < f. As posições armazenando elementos da fila estão salientadas. 


Usando o módulo operador para implementar um arranjo circular 


Implementar esta visão circular de О é bastante fácil. Cada vez que se incrementa f ou г, 
simplesmente calcula-se este incremento como "(f + 1) mod N ou “(г + 1) mod Nº, respecti- 
vamente. 

Deve-se lembrar que o operador “mod” é o operador módulo que é calculado avaliando-se 
o resto de uma divisão inteira. Por exemplo. 14 dividido por 3 é 4, com resto 2, de forma que 
14 mod 4 = 2. Mais especificamente, dados os inteiros x e y tal que x = Ое y > 0, tem-se que x 
mod y = х — [у у. Isto é, ser = x mod у, então há um inteiro não negativo q, de tal modo que 
X = qv + г. Java usa "96" para denotar o operador módulo. Usando este operador, pode-se ver 
O como um arranjo circular e implementar cada método de uma fila em um tempo constante (ou 
seja, tempo Of 11). Apresenta-se como usar esta abordagem para implementar uma fila no Trecho 
de código 5.14. 

Algoritmo size |: 

retorna (N — f+ ry mod М 
Algoritmo isEmptyt |: 

retorna (f = r) 

Algoritmo fronti |: 
se isEmpty( ) então 
lançar uma QueueEmptyException 
retorna |] 
Algoritmo dequeuel |: 
se sEmpty() então 
lançar uma QueueEmptyException 

temp + QI] 

ОЛ — null 

fe (f +1) mod N 

retorna temp 
Algoritmo enqueuel e): 

se size) = N- | então 

lançar uma FullQueueException 
gir] — е 
re ir + l) mad N 


Trecho de código 5.14 Implementação de uma fila usando um arranjo circular, A implementa- 
ção usa o operador módulo para “reverter” índices após o final do arranjo, e inclui duas variáveis 
de instância, fer que indexam a frente da fila e a primeira posição vazia após o fim da fila, 
respectivamente. 
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A implementação apresentada tem um detalhe importante que pode passar despercebido a 
princípio, Considere-se o que ocorre se forem enfileirados N objetos em Q sem que nenhum seja 
retirado da fila. Resultaria f = г que é a mesma condição que acontece quando a fila está vazia. 
Assim, não é possível determinar a diferença entre uma fila cheia e uma vazia. Felizmente, este 
não é um grande problema, e existem várias maneiras de resolvê-lo. 

A solução que será descrita consiste em exigir que © nunca contenha mais que N = 1 obje- 
tos. Esta regra simples para tratar de uma fila cheia contorna o último problema desta implemen- 
tação e leva ao pseudocódigo mostrado no Trecho de código 5.14. Observa-se que foi introduzida 
uma exceção chamada FullQueueException, que é especifica desta implementação para sinalizar 
que não se pode mais inserir elementos na fila. Também observa-se a forma usada para calcular 
o tamanho da fila através da expressão (N — f + rjmod №, que fornece o resultado correto tanto 
na configuração "normal" (quando f = гу como na configuração "reversa" (quando r = f). А 
implementação em Java de uma fila usando arranjos é similar à implementação de uma pilha, e é 
deixada como exercício (P-5.4). 

A Tabela 5,2 mostra os tempos de execução dos métodos em uma implementação de fila feita 
com um arranjo. Assim como a implementação de pilha baseada em arranjo apresentada, cada 
um dos métodos da fla realiza um número constante de instruções consistindo em operações 
aritméticas. comparações e atribuições. Assim, cada método nesta implementação é executado 
em tempo Of 1). 


isEmpty | OM) 
E front alt 


enqueua | ol) 
dequeue | CHI) 


Tabela 5.2 Desempenho de uma fila implementada através de arranjo. O espaço utilizado é 
O(N), onde N é o tamanho do arranjo, determinado quando a fila é eriada, Observa-se que o uso 
de espaço é independente do número n — N de elementos que estão na fila. 


Da mesma forma que a implementação de pilha baseada em arranjo, a Única desvantagem 
real da implementação de fila baseada em arranjo é que se define artificialmente a capacidade da 
fila em um valor fixo, Em uma aplicação real pode-se precisar de mais ou menos capacidade na 
fila, mas se a estimativa do número de elementos que deverão estar na fila em um dado momento 
é boa, então a implementação baseada em arranjo é bastante eficiente. 


9.2.3 


Implementando uma fila usando uma lista encadeada genérica 


Pode-se implementar de forma eficiente o TAD fila usando uma lista simplesmente encadeada. 
Por razões de eficiência, definiu-se que a frente da fila seja o início da lista, e que o final da fila 
seja o final da lista, (Por que seria ruim inserir no início e remover no final?) Observa-se que é 
necessário manter referências para os nodos do inicia e do final da lista, Em vez de descrever 
todos os detalhes da implementação, será mostrada uma implementação Java para os métodos 
fundamentais para filas no Trecho de código 5.15. 
public void enqueue(E elem) | 
Node-E- node = new Node-E-( |; 
node.setElement(elem); 
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node.setNextinull); // nodo será o novo nado do final 


if (size == 0) 
head = node; // caso especial de uma lista previamente vazia 
else 


tail setMextinode!): if adiciona nodo no final da lista 
tail = node; // atualiza referência ao nodo do final 
Sze +: 


public E dequeve( | throws EmptyQueueException ( 
if (size == 0) 
throw new EmptyQueueException(*Queue is empty. "); 
E tmp = head.getElement( |; 
head = head.getNaxti |; 
siza——; 
if (size == 0) 
tail = null; “a fila está vazia agora 
return tmp; 
) 


Trecho de código 5.15 — Métodos enqueue с dequeue па implementação do TAD fila usando 
uma lista simplesmente encadeada, usando nodos da classe Node do Trecho de código 5.6. 


Cada um dos métodos da implementação com lista simplesmente encadeada do TAD fila 
é executado em tempo (041), Não é necessário especificar um tamanho máximo para a fila 
como se fez na implementação baseada em arranjos, mas este beneficio tem o preço de usar 
mais espaço de memória por elemento. Os métodos usados na implementação com lista enca- 
deada são mais complicados do que se gostaria, pois se deve ter cuidado em lidar com casos 
especiais em que a fila está vazia antes de um enqueve, ou quando a fila fica vazia depois de 
um dedqueua. 


5.2.4 Escalonadores round-robin 


Um use popular da estrutura de dados fila é implementar um escalonador round-robin, no qual 
se itera através de uma coleção de elementos de forma circular e "atende-se" cada elemento exe- 
cutando uma certa ação sobre ele. Tal escalonador é usado, por exemplo, para fazer uma alocação 
justa de um recurso que tem de ser compartilhado por uma colegio de clientes. Por exemplo, 
pode-se usar um escalonador round-robin para alocar uma fatia do tempo da CPU para várias 
aplicações que estão executando concorrentemente em um computador. 

Pode-se implementar um escalonador round-robin usando uma fila, (J, executando de forma re- 
petitiva os seguintes passos (ver Figura 5.5): 


1. e«— (.dequeue( |: 
2. Atende o elemento e 
3. Q.enquauale) 


O problema de Josephus 


No jogo infantil “batata quente”, um grupo de м crianças senta em círculo e passa um objeto, 
chamado de “batata”, ao redor do círculo. A batata começa com uma das crianças do círculo, 
е às outras crianças continuam passando a batata até que um líder toque um sino, momento no 
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2. Atende o à. Enfileira o 
próximo elemento elemento atendido 


|. Retira à 
próximo elemento 


Atendimento 
compartilhado 


Figura 5.5 Os três passos iterativos quando se usa uma fila para implementar um escalonador 
round-robin, 


qual a criança que estiver com a batata deve sair do jogo, após deixar a batata com a próxima 
спапса do círculo. Após a criança selecionada sair, as demais fecham a roda. Este processo 
continua até que a criança remanescente é declarada a vencedora. Se o líder sempre usa a es- 
tratégia de tocar o sino após a batata ter sido passada k vezes, para algum valor fixo k, então 
a determinação do vencedor para uma dada lista de crianças é conhecida como o problema 
de Josephus. 


Resolvendo o problema de Josephus usando uma fila 


Pode-se resolver o problema de Josephus para uma coleção de n elementos usando uma fila, 
associando a batata com o elemento na frente da fila, e armazenando os elementos na fila de 
acordo com sua disposição ao redor do círculo. Assim, passar a batata é equivalente a retirar 
um elemento da fila e enfileirá-lo novamente. Após esse processo ter sido executado k vezes, se 
remove o elemento do início, retirando-o o da fila e descartando-o. Um progama Java completo 
para resolver o problema de Josephus usando esta abordagem é apresentado no Trecho de código 
5.16, que descreve uma solução que executa em tempo Oink) (este problema pode ser resolvido 
mais rapidamente usando técnicas que estão além do escopo deste livro). 


import net.datastructures.*; 
public class Josephus [ 
/** Solução para o problema de Josephus usando uma fila */ 
public static <E> E Josephus(Queus--E-- O, int k) | 
if (Q.isEmpty( )) return null: 
while (C.size() > 111 
System.out.printin" Queue: "+0Q+" k = "+ 
for (int i=0; i = k; i++} 

Q.enqueue(Q.dequeued 1); ff move o elemento do inicio para o fim 
Ee-Qdequeue(; “remove o elemento da frente da coleção 
System.out.printin" "+e+" is out") 

} 
return G.dequeue( |; /! o vencedor 


/** Cria uma fila a partir de um arranjo de objetos */ 
public static <E> Queue<E> buildQueusfE al ]) { 
Queue--E- Q = new NodeQueue--E-(); 
for (int i0; <a. length; i++) 
Q.enqueueal!]): 
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return С; 

} 

/** Método de teste */ 

public static void main(String[ ] args) | 
String] ] al = ("Alice", "Bob", "Cindy", "Doug", "Ed", "Fred"); 
Stringi ] a2 = ("Gene", "Hope", "Irene", "Jack", "Kim", "Lance" 
String| ] a3 = ("Mike", "Roberto"k 
Systern.out.printin{"Firet winner ів " + Josephusi(buildCueue(a1), 3); 
System.out printin(*Second winner is "-Josephus(buildCiueue(a2), 101): 
System.out.println("Third winner is " + Josephus(buildQueue(a3), 7): 

] 

} 


Trecho de código 5.16 Um programa Java completo para resolver o problema de Josephus 
usando uma fila, A classe NodeQueue é apresentada no Trecho de código 5.15. 


53 Filas com dois finais 


Considere-se agora uma estrutura de dados similar a uma fila que suporta inserção e remoção 
tanto em seu final, quanto em seu início, Esta extensão das filas é chamada de fila com dois 
finais ou deque, que normalmente pronuncia-se “deck” para evitar confusão com o método 
dequeue de um TAD fila normal, o qual pronuncia-se da mesma forma que a abreviatura 
“DQ, 


5.3.1 O tipo abstrato de dados deque 


O tipo abstrato de dados deque é mais rico do que os tipos TAD pilha e fila. Os métodos funda- 
mentais para o TAD deque são os que seguem: 
addFirst(e)y: Insere um novo elemento e no começo do deque. 
аба азі): Insere um novo elemento e no final do deque. 
removeFirst(): Remove e retoma o primeiro elemento do deque; ocorre um erro se o 
deque estiver vazio, 
removeLasti(): Remove e retorna o último elemento do deque; ocorre um erro se o 
deque estiver vazio, 
Adicionalmente, o TAD deque pode incluir os seguintes métodos auxiliares: 
getfirst(): Retoma o primeiro elemento do deque; ocorre um erro se o deque esti- 
ver vazio. 
getlast(): Retorna o último elemento do deque; ocorre um erro se o deque estiver 
vazio. 
size(): Retoma o número de elementos do deque. 
isEmpty(): Determina se o deque está vazio. 
Exemplo 5.5 A tabela a seguir mostra uma série de operações e seus efeitos em um deque D. 
inicialmente vazio, de objetos inteiros. Para simplificar, usam-se inteiros em vez de objetos intel. 
ros como argumentos das operações. 


EN do T. Considere à pronúncia em inglês. 
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5.3.2 


| Operação — 

f insertFirst( 3) 
insertFirst(3) 
removeFirst() 
insertLast(7) 
гетме геі) 

| removeLast) 

removeFirstl) 


isEmpty() 


Implementando um deque 


Já que o deque requer inserção e remoção em ambos os extremos da lista, usar uma lista simples- 
mente encadeada para implementar um deque seria ineficiente. Pode-se usar uma lista duplamen- 
te encadeada, entretanto, para implementar um deque de forma eficiente. Como foi analisado na 
Seção 3,3, inserir ou remover elementos nos dois extremos de uma lista encadeada pode ser feito 
de forma direta em tempo (41), se forem usados nodos sentinela para a cabeça e a cauda. 

Para inserir um novo elemento e, deve-se ter acesso ao nodo p anterior ao local onde e deve 
ser colocado e a0 nodo q posterior ao local onde e deve ser colocado. Para inserir um novo ele- 
mento entre p é q (que podem ser sentinelas), cria-se um novo nodo г, acertam-se as conexões 
next e prev de г para que apontem para q e р. respectivamente, depois faz-se com que o next de p 
aponte para гео prev de q aponte para t. 

Da mesma forma, para remover um elemento localizado no nodo г, podem-se acessar os 
nodos p e q em cada lado de t (e estes nodos devem existir, desde que se estejam usando sen- 
tinelas 

Para remover o nodo r entre p e q, simplesmente faz-se com que p e q apontem um para o 
outro, em vez de apontar para г. Não é necessário alterar as informações em г, pois agora | será 
detectado pelo algoritmo de coleta de lixo, pois ninguém está apontando рага г. 


size, isEmpty 


getFirst, getLast 
addFirst, addLast 
remoweFirst, removeLast 


Tabela 5.3 Performance de um deque implementado usando uma lista duplamente encadeada. 


Deste modo, uma lista duplamente encadeada pode ser usada para implementar cada método 
do TAD deque, em tempo constante. Os detalhes de uma implementação Java eficiente do TAD 
deque ficam como exercício (P-5,7), 

Casualmente, todos os métodos do TAD deque, como descritos acima estão incluidos na clas- 
se Java util LinkedList<Es. Assim, se for necessário usar um deque e não for o caso implementar 
um desde o início, pode-se simplesmente usar a classe predefinida java util.LinkedList<E>. 

Em qualquer caso, apresenta-se a interface Deque no Trecho de código 5.17, e a implemen- 
tação desta interface no Trecho de código 5.18, 
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yon 
ѓе Interface para um deque: uma coleção de objetos que são inseridos e removidos em 
2 ambas as extremidades; um subconjunto dos métodos de Java.util.LinkedList. 
* Gauthor Roberto Tamassia 
* Bauthor Michael Goodrich 
ep 
public interface Deque< E = 
Per 
* Retorna o número de elementos no deque 
aj 
public int size |; 
ptt 
* Retorna se o deque está vazio 
wi 
public boolean isEmpty( |; 
"bule 
t Retorna o primeiro elemento; uma exceção é lançada se o deque está vazio. 
E 
public E getFirst( ) throws EmptyDequeExceptian; 
Per 
* Retorna o último elemento; uma exceção е lançada se o deque está vazio. 
E 
public E дей а= ) throws EmptyDequeException; 


ak: 

, Insere um elemento para ser o primeiro do deque. 

+ 

Ga void addFirst (E element); 

** 

= insere um elemento para ser o último do dague, 

+ 

publie void addLast (E element); 

k 

= Hemove o primeiro elemento; uma exceção é lançada se o deque está vazio. 
E 

pub E removeFirsti ) throws EmptyDequeException; 
“ Remove o último elemento; uma exceção é lançada se o deque está vazio. 
E 

LENT E removeLast( ) throws EmptyDequeExceptlon; 


} 


Trecho de código 5.17 Interface Deque documentada com comentários em estilo Javadocs 
(Seção 1.9.3). Nota-se também o uso do parámetro de tipo genérico, E, o que implica que o deque 
pode armazenar elementos de qualquer classe. 


public class NodeDeque--E-- implements Dequec E = { 


protected DLNode<E> header, trailer; if Sentinelas 
protected int size; fi Número de elementos 
public NodaDegue ) ( # Inicializa um degue vazio 


header = new DLMode--E-(J, 

trailer = new DLNode<E>(}; 

headersetMextitraler; ¿faz a cabeça apontar para a cauda 
trailer setPrev(header), faz a cauda apontar para a cabeca 
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size = O: 


public int size) { 
return size; 
| 
public boolean isEmpty() | 
if (size == 0) 
return true; 
return false; 


} 
public E gatFirst() throws EmptyDequeException | 
if iisEmptyt }) 
throw new EmptyDequeException("Deque is empty." 
return header. getNext ).getElernentí y; 
| 
public void addFirst(E o) | 
DLNode<E> second = header. getMext( |; 
DLMode--E-- first = new DL Mode--E- (a, header, second); 
second.setPrevilirst); 
header.setNext(first); 
Siza +: 


} 

public E removeLast( ) throws EmptyDequeException ( 
if isEmpty |) 

throw new EmptyDequeException("Deque is empty." 

DLMode--E- last = trailer.getPrev |: 
Eo = last. getElementí |; 
DLNode--E-- secondtolast = last getPrew j; 
trailer. setPrevisecondtolast): 
secondtolast.setNextitraller}; 
siza— —; 
return o; 

| 

} 


Trecho de código 8.18 Classe NodeDeque implementando a interface Deque, não sendo mos- 
irados nem a classe DLNode, que corresponde a um nodo genérico de lista duplamente encadea- 
da, nem os métodos getLast e addLast ou removeFirst. 


5.4 Exercícios 


Para obter ajuda e o código fonte dos exercícios, visite java.datastructures.net. 


Reforço 


R-5.1 Suponha que uma lista inicialmente vazia 5 tenha executado um total de 25 
operações push, 12 operações top e 10 operações pop, 3 das quais geraram 
StackEmptyExceptions, que foram capturadas e ignoradas. Qual é o tama- 
nho corrente de $? 

R-5,2 Se implementarmos a pilha 5 do problema anterior usando um arranjo, 
como descrito neste capítulo, então qual será o valor corrente da variável de 
instância top? 
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R-5.7 


R-5.8 


R-5.9 


R-3.10 


R-5.11 


Criatividade 


C-5.1 


Descreva a saída resultante da seguinte série de operações de pilha: push(5), 
push(3), popí ).push(2), push(B). popi ), pop( ), push(B), push(1), рор( ). 
push(7), push(6), popl). popl ). push(4), pop). pop ). 

Apresente um método recursivo para remover todos às elementos de uma 
pilha. 

Apresente uma definição precisa e completa do conceito de verificação de 
grupos de símbolos em uma expressão aritmética. 

Descreva a saída resultante da seguinte sequência de operações sobre uma 
fila: enqueue(5), enqueue(3), dequevel). enqueue(2), enqueve(B), dequeuei), 
dequeue( ). enqueve(9), enqueve(1), dequeue( ), enqueve(?). enqueue(5), 
dequeue( ), dequeve(), enqueue(4), dequeue( ), dequeuel ). 

Suponha que uma fila Q inicialmente vazia tenha executado um total de 
32 operações enqueue, 10 operações front e 15 operações dequeue, 5 das 
quais geraram exceções QueueEmptyException, que foram tratadas e igno- 
radas, Qual o tamanho аша! de g? 

Se a fila do problema anterior foi implementada com um arranjo de capaci- 
dade Nº = 30, como descrito neste capítulo, e nunca gerou uma FullQuene- 
Exception, quais podem ser os valores atuais de fe r? 

Descreva a saída para a seguinte sequência de operações sobre o TAD de- 
que: addFirst(3), addLast(8B), addLast(8), addFirst(5), removeFirst( ), ramo- 
velasti |, first‘ ), айа! ast(7), removeFirsti ), last), removeL азі). 


Suponha que você tem um deque D contendo os números (1,2,3,4,5,6,7,8), 
nesta ordem. Suponha, além disse, que você tem uma fila inicialmente va- 
zia O, Fornega uma descrição em pseudocódigo de um método que usa ape- 
nas De Q (e nenhuma outra variável ou objeto) e resulta D armazenando os 
elementos (1,2,3,4,5,6,7,8) nesta ordem. 


Repita o problema anterior usando o deque D e uma pilha inicialmente 
vazia 5. 


Suponha que você tem uma pilha 5 contendo n elementos e uma fila Q que 
está inicialmente vazia, Descreva como você pode usar Q para percorrer 5 
para ver se ela contém um certo elemento x, com a restrição adicional que 
seu algoritmo deve retornar os elementos de volta para 5 em sua ordem 
original. Você não pode usar um arranjo ou uma lista encadeada — apenas $ 
e Q e um número fixo de variáveis de referência. 

Apresente uma descrição em pseudocódigo de uma implementação hasea- 
da em arranjo de um TAD lista encadeada. Qual o tempo de execução de 
cada operação? 

Suponha que Alice selecionou 3 inteiros diferentes e os colocou em uma 
pilha 5 em qualquer ordem. Escreva um pequeno trecho de pseudocódigo 
(sem laços ou recursão) que use apenas uma comparação e apenas uma 
variável x. garantindo com probabilidade de 2/3 que ao final deste código a 
variável x irá armazenar o maior dos 3 inteiros de Alice. Argumente porque 
seu método está correto. 


С-5.4 


C-5.5 


C-5.6 


C-5.7 


C-5.8 


C-5.9 


C-5.10 


C-5.11 
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Descreva como implementar o TAD pilha usando duas filas. Qual o tempo 
de execução dos métodos push e pop neste caso? 

Mostre como usar uma pilha $ e uma fila 0 para gerar todos os possíveis 
subconjuntos de um conjunto T de n elementos de maneira não-recursiva. 


Suponha que se dispõe de um arranjo bidimensional A, n X т, que se deseja 
usar para armazenar números inteiros, mas não se pretende despender um 
esforço On’) para inicializä-lo com zeros (da forma que Java faz), porque 
sabe-se de antemão que serão usadas no máximo n células neste algoritmo 
que executa em tempo (Mn) (sem contar o tempo de inicialização). Mostre 
como usar uma pilha 5 baseada em um arranjo que armazena triplas (i у, 
k) para permitir o uso do arranjo A sem inicializá-lo e ainda implementar o 
algoritmo em tempo An), mesmo que os valores iniciais das células de A 
sejam um lixo completo, 


Descreva um algoritmo näo-recursivo para enumerar todas as permutações 
de números (I, 2...., n]. 


Notação pös-firada é uma forma não ambigua de escrever expressões arit- 
méticas sem usar parênteses. É definida de maneira que se “(exp )op(exp,)" 
é uma expressão normal completamente entre parênteses cujo operador é 
op, então a versão pós-fixada da mesma é “perp, pexp, op”, onde pexp, é a 
versão pós-fixada de exp, е pexp, é a versão pós-fixada de exp, A versão 
pós-fixada de um único número ou variável é o próprio número ou variável, 
Então, por exemplo, a versão pós-fixada de “((5+2) + (8— 3004" € "(5 2 + 
#3 = td", Descreva uma maneira não recursiva de avaliar uma expressão 
em notação pós-fixada. 


Suponha que você tem duas pilhas não vazias 5 e T e um deque D. Descreva 
como usar D de maneira que 5 armazene todos os elementos de T abaixo de 
seus elementos originais, mantendo os dois conjuntos de elementos em sua 
ordem original. 


Alice tem três pilhas baseadas em arranjo A, B e C, tais que A tem capaci- 
dade 100, B tem capacidade 5 e C tem capacidade 3, Inicialmente, A está 
cheio e Be C estão vazios. Infelizmente, as pessoas que programaram a 
classe para estas pilhas fizeram os métodos push e pop privados. O úni- 
co método que Alice pode usar é um método estático, transter(5,T), que 
transfere (aplicando iterativamente os métodos push e pop) os elementos 
da pilha 5 para a pilha T até que 5 fique vazio ou T esteja cheio. Então, por 
exemplo, começando na configuração inicial é executando transfer(A,C) 
resulta em A armazenando 97 elementos e C armazenando 3, Descreva uma 
sequência de operações de transferência que comece da configuração ini- 
cial e resulte em B armazenando 4 elementos no final, 


Alice tem duas filas, 5 e 7, que podem armazenar inteiros. Bob fornece para 
Alice 50 inteiros impares e 50 inteiros pares e insiste que ela armazene to- 
dos os 100 inteiros em 5 e T. Eles então iniciam um jogo onde Bob selecio- 
na 5 ou T aleatoriamente e aplica o escalonador round-robin, descrito neste 
capítulo, sobre a fila escolhida um número aleatório de vezes. Se o número 
que sair da fila ao final do jogo for ímpar, Bob ganha. Caso contrário Alice 
ganha. Como Alice pode distribuir os inteiros pelas filas de maneira a oti- 
mizar suas chances de vitória? Qual sua chance de vitória? 
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С-5.12 


P-5.1 
P-5.2 


P-5,3 


Р-5.7 
P-5.8 
P-5.9 


P-5.10 


Suponha que Bob tem quatro vacas e que ele quer levá-las através da ponte, 
Mas ele possui apenas um cambio, que une apenas duas vacas lado a lado. 
O cambáo é muito pesado рага que ele possa carregá-lo pela ponte, mas ele 
pode amarrar (e soltar) as vacas no mesmo, rapidamente. De suas quatro 
vacas, Mazie pode atravessar a ponte em 2 minutos, Dayse pode atravessar 
em 4 minutos, Crazy leva 10 minutos e Lazy pode fazê-lo em 20 minutos. 
Naturalmente, quando duas vacas estão presas ao cambio, elas devem an- 
dar na velocidade da vaca mais lenta. Descreva como Bob pode atravessar 
suas vacas pela ponte em 34 minutos. 


Projetos 


Implemente o TAD pilha usando uma lista duplamente encadeada. 
Implemente o TAD pilha usando a classe ArrayList de Java (sem usar a clas- 
se predefinida de Java, Stack). 

implemente um Programa Que pes Sd receber ша expresso em notação 
pos-fixada (ver Exercício C-5.8) e exibir seu valor. 

Implemente o TAD fila usando um arranjo. 

Implemente todo o TAD fila usando uma lista simplesmente encadeada, 


Projete um TAD para uma pilha dupla de duas cores que consiste em duas 
pilhas — uma “vermelha” e outra “azul” — € tem suas versões coloridas das 
operações normais de um TAD pilha. Por exemplo, este TAD pode admitir 
tanto uma operação push azul como vermelha. Apresente uma implemen- 
tação eficiente deste TAD usando um único arranjo cuja capacidade é de- 
finida em um valor N que se assume ser maior que os tamanhos das pilhas 
vermelho e azul combinadas. 

implemente o [AD deque usando uma lista duplamente encadeada, 
Implemente o TAD deque usando um arranjo tratado de forma circular. 


Implemente as interfaces Stack e Queue com uma ünica classe que estende 
a classe NodeQueue (Trecho de código 5.8). 


Quando um lote de ações de uma companhia é vendido, o capital obtido 
tou às vezes perdido) é a diferença entre o preço de venda e o preço pago 
originalmente pelas ações. Esta regra é fácil de entender para uma única 
ação, mas se vendemos vários lotes de ações comprados ao longo de um 
periodo de tempo, então é necessário identificar as ações que estão sen- 
do vendidas. Um princípio padrão em contabilidade para a identificação 
de lotes de ações vendidas, neste caso, é o uso de um protocolo FIFO 
— as ações vendidas são aquelas que foram armazenadas mais tempo (na 
verdade este é o princípio padrão adotado em vários pacotes de software 
de finanças pessoais), Por exemplo, suponha que se deseja comprar 100 
ações a R$ 20,00 cada, no dia 1: 20 ações a R$ 24,00, no dia 2; 200 ações 
a RS 36,00, no dia 3; e então vender 150, ações, no dia 4, à R$ 30,00 cada. 
Então, aplicando o principio FIFO, significa que das 150 ações vendidas, 
100 foram compradas no dia 1, 20 no dia 2 е 30 no dia 3. O capital obtido 
neste caso for 100 - TO + 20 - 6 + 30 + 0-6), ou KS 940,00, Escreva um 
programa que recebe como entrada uma seqüéncia de transações do tipo 
"compre ações is) por Ry cada” ou "venda х ações (a) por 
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R$v cada”, assumindo que as transações ocorrem em dias consecutivos 
e que os valores de x e y são inteiros, Dada a sequência de entrada, a saída 
pode ser o capital total ganho (ou perdido) para a sequência completa, 
usando um protocolo FIFO para identificar as ações, 


Observações sobre o capítulo 


A abordagem de definir primeiro as estruturas de dados em termos de seus TADs e depois 
de suas implementações concretas foi introduzida pela primeira vez pelos livros clássicos de 
Aho, Hoperoft e Ullman [4,5]. que, não por acaso, são os primeiros trabalhos em que se vé um 
problema similar ao do exercício C-5.6. Os exercícios C-5. 10, C-5.11 e C-5.12 são similares 
às questões da entrevista ditas originárias de uma companhia de software bem conhecida. Para 
aprofundar seus estudos de tipos abstratos de dados, veja Liskov e Guttag [69], Cardelli e Weg- 
ner [20] ou Demurjian [28]. 
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6.1 


6.1.1 


Listas arranjo 


Suponha que se dispõe de uma coleção 5 de N elementos armazenados em uma certa ordem 
linear, de maneira que é possível se referir aos elementos de 5 como primeiro, segundo, tercei- 
ro e assim por diante. Tal coleção é conhecida genericamente como uma dista ou segiência. 
É possível fazer uma referência individual a cada elemento e de 5 usando um inteiro no inter- 
valo [U, п — 1] que é igual 20 número de elementos de 5 que precede e em 5. O índice de um 
elemento e em 5 é o número de elementos que estão antes de e em $. Conseqüentemente, o 
primeiro elemento de 5 tem indice O, e o último tem índice n — 1, Além disso, se um elemento 
de 5 tem índice i, o elemento anterior (se existir) tem indice é = 1, e o elemento seguinte (se 
existir) tem índice é + 1, O conceito de índice está relacionado ao conceito de calocacao* de 
um elemento em uma lista, que normalmente é definido como sendo um a mais do que seu 
índice; assim, o primeiro elemento está na primeira colocação, o segundo está na segunda 
colocação e assim por diante. 

Uma sequência que suporte acesso a todos os seus elementos através de seus indices ё cha- 
mada de disto arranjo (ou veter, usando um termo mais antigo). Uma vez que a definição de 
indice é mais consistente com a maneira pela qual os arranjos são indexados em Java e outras lin- 
guagens de programação (tais como C e C++), 0 lugar onde um elemento é armazenado em uma 
lista será referido como "indice", e não “colocação” (apesar de ser usada a letra r* para denotar 
este indice se a letra i estiver sendo usada como contador de um laço de for). 

Este conceito de indice é uma notação simples, porém, poderosa, uma vez que pode ser 
usada para especificar onde inserir um novo elemento em uma lista ou onde remover um ele- 
mento antigo. 


O tipo abstrato de dados lista arranjo 


Como um TAD, uma dista arranjo tem os seguintes métodos (além dos métodos padrão size( ) e 
isEmpty |: 
get(ry retorna o elemento de 5 com índice i uma condição de erro ocorre se 
ic 0 ou i — size() — 1. 
satii ek substitur por e e retorna o elemento de indice 1; uma condição de erro 
core se г = Dou i => size() — I. 
addii е}: insere um elemento novo e em $ para que tenha o índice ў; uma condi- 
ção de erro ocorre se = Ü ou 7 — size |. 
remove(iy remove de 5 o elemento de índice é; uma condição de erro ocorre se i 
= 0 ou f > size ) — |. 


Não se afirma que um arranjo deva ser usado para implementar uma lista arranjo e que, neste 
caso, o elemento de indice O deva ser armazenado no índice O do arranjo, embora esta possa ser 
uma possibilidade (muito natural). A definição de indice oferece uma forma de referir o “lugar” 
onde o elemento está armazenado em uma seglência, sem preocupações com a implementação 
exata desta seqüéncia. O índice de um elemento pode se alterar sempre que a sequência é atuali- 
zada, como ilustrado no exemplo a seguir. 


+N. de T. Em inglés, rank. 
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Exemplo 6.1 Apresentam-se a seguir algumas operações sobre uma lista arranjo S inicialmen- 
te vazia. 


addi. 7) (7) 


add(0,4) | (4,7) 

| geil) 7 (4,7) 

| або 2,2) (4,7,2) 
get(3) | error (4,7, 2) 

| remover) 7 (4,2) 

‚ add 1,5) (4,5,2) 

| add 1,3) (4,3,5,2) 
addi 4,9) (4,3,5,2,9) 
get(2) 3 (4,3, 5,2, 9) 
set 3, 8) 2 (4,3, 5,8, 9) 


6.1.2 O padrão adaptador 


Com freqüéncia, escrevem-se classes que provêem funcionalidades similares a outras classes. O 
padrão adaptador se aplica a qualquer contexto em que se deseja modificar uma classe existente 
de maneira que seus métodos combinem com as de uma classe ou interface relacionada mas 
diferente. Uma forma geral de aplicar o padrão adaptador é definir uma classe nova de maneira 
que ela contenha uma instância da classe velha como um campo escondido, e implemente cada 
método da nova classe usando os métodos desta variável de instância escondida. O resultado da 
aplicação do padrão adaptador é que se cria uma nova classe que executa praticamente as mes- 
mas funções da classe anterior. mas de uma forma mais conveniente. 

Em relação à discussão sobre o TAD lista arranjo, percebe-se que este TAD é suficiente para 
definir uma classe adaptadora para o TAD deque, como pode ser visto na Tabela 6.1 (ver também 
o Exercício C-6.8) 


Método de deque | Implementação com métodos de lista arranjo 
size(), isEmpty() | size(), isEmpty() Е 

getFirst( ) get) 

getLasti | | get(size() = 1) 


addFirstle) ada. e) 

абд азе addísizel |, e) 
removeFirst( ) removal) 
removeLast( | removealsizel | — 1) 


Tabela 6.1 Implementação de um deque como uma lista arranjo. 


6.1.3 Uma implementação simples usando arranjo 


Uma escolha óbvia para implementar o TAD lista arranjo é usar um arranjo A, onde Ali] armaze- 
na (uma referência para) o elemento de indice г. Escolhe-se o tamanho N do arranjo A grande o 
suficiente, e se mantém a quantidade de elementos em uma variável de instância n < N. 


210 


Estruturas de Dados e Algoritmos em Java 


Os detalhes de implementação dos métodos do TAD lista arranjo são simples. Para imple- 
mentar a operação get(i), por exemplo, apenas retorna-se A[i]. A implementação dos métodos 
addi, e) e remove(i) é fornecida no Trecho de código 6.1. Uma parte importante desta implemen- 
tação (e que demanda tempo) envolve o deslocamento de elementos para cima ou para haixo, 
para manter contíguas as células ocupadas do arranjo. Essas operações de deslocamento são 
necessárias para manter a regra de sempre armazenar o elemento de indice i no índice i do arranjo 
A. (Ver a Figura 6.1 е também o Exercício R-6.12). 


Algoritmo addí ie): 
para = л – Ln—2...,¿faca 
Alf + 1] e Ali | Abre espaço para o novo elemento] 
All ee 
п л | 


Algoritmo removeri): 
e TAIL!) [e é uma variável temporária | 
para ¡=1,1+1,...,.n — 2 faça 
АП # Alf + 1] [substitui pelo elemento removido | 
# i=] 
return e 


Trecho de código 6.1 Métodos addii, e) e remove() da implementação de um TAD lista ar- 
ranjo. Denota-se por n a variável de instância que armazena a quantidade de elementos na lista 


arranjo. 
E 17 a a u! ГА 
pow оа ow + 
‚ 
о} F (ai a] wel 
EN, ч М, ҮМ ik’ 
ТХ ELLE 
9 x0 1 F (b) п—1 Wel 


Figura 6.1 Implementação baseada em um arranjo de uma lista arranjo 5, armazenando n ele- 
mentos: (a) deslocando uma posição para cima para inserir no indice i; (h) deslocamento para 
baixo para remover do índice i. 


Performance da implementação simples baseada em arranjo 


А Tabela 6.2 indica os tempos de execução para o pior caso dos métodos de uma lista arranjo 
de n elementos, implementada usando um arranjo, Os métodos isEmpty, size, get e set claramen- 
te executam em um tempo С 1), mas os métodos de inserção e remoção podem consumir muito 
mais tempo. Especialmente, o método адо, e), executa em tempo Or}. Na verdade, o pior caso 
para esta operação ocorre quando é = (0, uma vez que todos os л elementos terão de ser desloca- 
dos para frente, Argumento similar se aplica ao método remove(i), que executa em tempo Om) 
porque é necessário mover п = | elementos uma posição para trás, no pror caso (1 = 01. De fato. 
assumindo que todos os índices têm igual probabilidade de serem passados por parâmetro, para 
estas operações o tempo de execução médio é (Mr), pois é necessário deslocar n/2 elementos, 
em média. 
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| Método Tempo 
ветру) ГОП) 
| add(ie) | {i e) CON 


Tabela 6.2 Performance de uma lista arranjo de n elementos, implementada usando um arran- 
jo. O espaço usado é O(N), onde N é o tamanho do arranjo. 


Analisando com mais cuidado add(i,e) e remove(i) percebe-se que executam em um tem- 
po Oia — ¿+ 1) pois apenas os elementos da posição i € superior deverão ser deslocados. 
Logo, a inserção ou remoção de um item no fim de uma lista arranjo usando os métodos 
addí(ie) e remove(i — 1), respectivamente, consome tempo O1). Além disso, esta observação 
tem uma consequência interessante na adaptação do TAD lista arranjo para o TAD deque, 
apresentado na Seção 6.1.1. Se o TAD lista arranjo, neste caso, é implementado sobre um 
arranjo como antes descrito, então os métodos addLast e removeLast do deque executam cada 
um em tempo © 1). Entretanto, os métodos addFirst e removeFirst do deque executam cada 
um em tempo Gin). 

Na verdade, com um pequeno esforço, pode-se criar uma implementação baseada em arranjo 
para o TAD lista arranjo que resulte em tempo CN 1) para inserções e deleções na colocação 0), 
bem como nas inserções e deleções no fim da lista arranjo. Obter isso implica abandonar a regra 
que determina que um elemento de índice i deve ser armazenado no índice i do arranjo, e usar 
uma abordagem baseada em um arranjo circular semelhante à usada na Seção 5.2 para imple- 
mentar uma fila. Os detalhes dessa implementação são deixados como exercicio (C-6.9). 


6.1.4 A interface simples e a classe java.util. ArrayList 


Para preparar a construção de uma implementação Java do TAD lista arranjo, apresenta-se, no 
Trecho de código 6.2, uma interface Java, IndexList, que captura os principais métodos do TAD 
lista arranjo. Neste caso, usa-se uma IndexOutOfBoundsException para sinalizar um argumento 
de indice inválido. 


public interface IndexList<E> { 
/** Retorna a quantidade de elementos desta lista. */ 
public int size |; 
/** Retorna se a lista está vazia. */ 
public boolean isEmptyl ); 
/** |nsere um elemento e de maneira que o mesmo ocupe o indice |, deslocando todos os 
elementos depois deste. */ 
public void add(int i, E e) 
throws IndexOutOfBoundsException; 
Pek Retorna o elemento no indice i, sem remové-lo, */ 
public E getfint i) 
throws IndexOutOfBoundsException; 
/** Remove e retorna o elemento no indice i, deslocando os elementos após este. */ 
public E removedint i) 
throws IndexOutOfBoundsException, 
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/** Substitui o elemento no Indice i por e, retornando o elemento anterior em i. */ 
public E setünt i, E el 
throws IndexOutOlBoundsException; 


Trecho de código 6.2 A interface IndexList para o TAD lista arranjo. 


А classe java util. ArrayList 


Java oferece uma classe, java.util.ArrayList, que implementa todos os métodos fornecidos ante- 
riormente para o TAD lista arranjo. Isto é, inclui todos os métodos apresentados no Trecho de 
código 6.2 da interface IndexList. Mais que 1950, à classe Java.util.ArrayList tem recursos além 
dos do TAD lista arranjo simplificado, Por exemplo, a classe Java util. ArrayList também inclui 
um método clear, que remove todos os elementos da lista arranjo e um método toArray( ), que 
retoma um arranjo contendo todos os elementos da lista arranjo na mesma ordem. Adicional- 
mente, a classe java. util. ArrayList dispõe de métodos para pesquisa na lista, incluíndo o método 
indexOf(e que retorna o indice da primeiro ocorrência do elemento igual a e na lista arranjo 
eo método lastindexOf(e), que retoma o índice da última ocorréncia do elemento igual a e na 
lista arranjo. Os dois métodos retomam o índice inválido —1 se um elemento igual a e não for 
encontrado. 


6.1.5 


implementando uma lista arranjo usando arranjos extensiveis 


Além de implementar os métodos da interface IndexList (e alguns outros métodos úteis), a classe 
java util.ArrayList provê um recurso interessante que sobrepõe a fraqueza da implementação sim- 
ples baseada em arranjo, 

Especificamente, o ponto mais fraco da implementação simples usando um arranjo do 
TAD lista arranjo, fornecida na Seção 6.1.3, é que esta exige a especificação antecipada de 
uma capacidade fixa, M, para o número total de elementos que podem ser armazenados na lista 
arranjo, Se o número real de elementos n da lista arranjo for muito menor que N, então a im- 
plementação irá desperdiçar espaço. Pior ainda, se л for maior que №, então a implementação 
irá falhar. 

Em vez disso, a classe java utll. ArrayList usa uma técnica interessante de arranjo extensí- 
vel, de maneira que não é necessário se preocupar com estouros do arranjo quando se usa esta 
classe. 

Da mesma forma que a classe java.util ArrayList, será providenciada uma forma de au- 
mentar o arranjo А que armazena os elementos da lista arranjo 5. É claro que em Java (e 
outras linguagens de programação) não se pode realmente aumentar o arranjo A; sua capa- 
cidade € fixa para um determinado valor №, como já foi visto, Em vez disso, quando ocorre 
uma situação de overflow, ou seja, quando n = Ne o método add é ativado, executam-se os 
seguintes passos: 


1. Alocar um novo arranjo Ё com capacidade 4w 

2. Fazer Ali] + Bllparar=0,...N—1 

3. Fazer A — B, ou seja, usar B como sendo o arranjo que suporta 5 
4. Inserir o novo elemento em A 


Esta estratégia de substituição de um vetor é conhecida como arranjo extensível, na medida 
em que pode ser vista como a ampliação do arranjo base para abrir mais espaço para novos ele- 
mentos (ver Figura 6.2). Intuitivamente, esta estratégia é semelhante à de um bemardo-ermitão, 
que se muda para uma concha maior quando fica maior que a anterior. 
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+ HEHE ^ иШ CEE 
: CLO 5 MEN 11) ^ инини 
(a) (b) (e) 


Figura 6.2 Representação dos três passos para “fazer crescer” um arranjo extensível: (a) criar 
um novo arranjo B; (b) copiar os elementos de A para B; (c) atribuir o novo arranjo para a referén- 
cia A. Não é mostrado que o arranjo antigo será eliminado pelo sistema de coleta de lixo. 


Implementando a interface IndexList usando um arranjo extensível 


Partes da implementação em Java do TAD lista arranjo usando um arranjo extensível são 
apresentadas no Trecho de código 6.3. Esta classe provê apenas a capacidade de expansão do 
vetor. O Exercício C-6.2 explora uma implementação que também pode encolher. 


/** Implementação de uma lista encadeada usando um arranjo cujo tamanho é duplicado 
* quando o tamanho da lista indexada excede a capacidade do arranjo. 


u 

public class ArraylndexList<E> implements IndexList<E> [ 
private El ] A; H arranjo que armazena os elementos da lista indexada 
private int capacity = 16; 4 tamanho inicial do arranjo А 
private int size = 0; if número de elementos armazenados па lista indexada 
/** Cria a lista indexada com capacidade inicial 16 *f 
public ArrayindexList() { 


А = (E[ ] new Objecticapacity]; //o compilador vai avisar. mas está ok 


/** insere um elemento no indice especificado. */ 
public void add(int г, E е) 
throws IndexOutOfBoundsException { 
checkindexir, size( ) + 1); 
if (size == capacity) | ¿Hum overflow 
capacity "= 2; 
Е[] В = (E[ |) new Object[capacity]; 
for (init i0; size; i++) 
Bl] = A[i]; 
А = В; 


for (int izsize - 1; i>=r; 1 —) ff desloca um elemento para cima 
Ali+1] = Ali); 

Alr] = е; 

Size; 


| 
/** Remove o elemento armazenado no indice especificado. */ 
public E remove(int г) 
throws IndexOutOfBoundsException | 
checkindexír, sizei j; 
E temp = Afr]; 
for (int lar; asiza- 1; ie) N desloca um elemento para baixo 
Ali] = A[i«1]; 
ize —; 
return temp; 
} 
Trecho de código 6.3 Partes da classe ArraylndexList que implementa o TAD lista arranjo 
usando um arranjo extensível, O método checkindex(r,n) (não apresentado) verifica se um indice 
r pertence ao intervalo (0, л — 1]. 
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Análise amortizada de um arranjo extensivel 


A estratégia de substituição de arranjos pode parecer lenta, à primeira vista, pois a execução de 
uma única substituição, necessária em certas operações de inserção, levará tempo Of). Observa- 
se, porém, que após uma substituição, o novo arranjo permite a inserção de outros п elementos 
novos antes que o arranjo tenha de ser substituído outra vez. Este simples fato permite mostrar 
que o tempo de uma série de operações executadas sobre um vetor inicialmente vazio é realmente 
bastante eficiente, Usando uma notação abreviada, a operação de inserir um elemento no final de 
um vetor será chamada de push (ver Figura 6.3). 


Tempo de execução da operação push 


| 2 3 4 5 676910] 12 13 14 15 16 
Quantidade atual de elementos 


Figura 6.3 Tempos de execução de uma série de operações push sobre um java util ArrayList 
de tamanho inicial 1. 


Utilizando um padrão de projeto chamado de amortização, pode-se mostrar que executar 
uma sequência de operações push em um vetor implementado sobre um arranjo extensível é 
realmente muito eficiente. Para fazer uma andlise amortizada, será usada uma técnica de conta- 
corrente na qual um computador será visto como uma máquina que necessita a inserção de mo- 
edas para funcionar, e que requer o pagamento de um ciberdófar para cada periodo determinado 
de uso, Quando uma operação é executada, é necessário ter ciberdólares suficientes na “conta de 
ciberdólares” para pagar o tempo de execução da operação, Então, o total de ciberdólares gastos 
para qualquer cálculo será proporcional ao tempo gasto naquele cálculo. A vantagem deste mé- 
todo de análise é que se pode supervalorizar certas operações de maneira a poupar ciberdólares 
рага pagar Outras, 


Proposição 6.2 Seja 5 uma lista arranjo implementada sobre um arranjo extensível de tama: 
nho 1. O tempo total para executar uma série n de operações push sobre $, iniciando com 5 vazio 
ë On). 

Justificativa Assume-se que um ciberdólar é suficiente para pagar a execução de cada opera- 
ção push sobre 5, desconsiderando o tempo para fazer o arranjo crescer. Supõe-se também que 
aumentar o arranjo de um tamanho k para Ik, requer E ciberdálares para o tempo gasto copiando 
os elementos. Pode-se cobrar por cada operação push 3 ciberdólares. Desta forma, se está sobre- 
taxando cada operação push que não causa overflow, em dois ciberdólares. Considere-se que os 
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dois ciberdölares de lucro obtidos nas inserções que não aumentam o arranjo são “armazenados” 
junto ao elemento inserido, Um overflow ocorre quando o vetor 5 tem 2 elementos, para um 
inteiro ! = 0, e o tamanho do arranjo usado para representá-lo tem tamanho 2. Entáo, dobrar o 
tamanho do arranjo requer 2 ciberdólares, Felizmente, estes ciberdólares podem ser encontrados 
nos elementos armazenados nas células 2 а F — | (vera Figura 6.4). Observa-se que o overflow 
anterior ocorreu quando o número de elementos ficou maior que 2 pela primeira vez e os ci- 
berdólares armazenados nas células 2" a 2" — 1 não foram gastos, Desta forma, dispöe-se de um 
esquema de amortização no qual se cobram 3 ciberdólares por cada operação e todo o tempo de 
cálculo é pago. Ou seja, se paga pela execução de n operações push usando An ciberdólares, Em 
outras palavras, o tempo de execução amortizado de cada operação é O1); assim, o tempo total 
de execução de n operações push é Om. " 


0000 
0000 


(a) 


(b) O 


Ea 
A 


0 1 4 5 6 7 B 9 IO 11 12 13 14 15 


Figura 6.4 Representação de uma série de operações push sobre uma lista arranjo: (a) um 
arranjo de tamanho 8 cheio, com dois ciberdölares “armazenados” nos índices de 4 a 7; (Б) uma 
operação push causa um overflow e duplica a capacidade. A cópia dos 5 elementos antigos para 
o novo arranjo é paga pelos ciberdólares armazenados; a inserção de novos elementos é paga por 
um dos ciberdólares cobrados pela operação push; os dois ciberdólares de lucro são armazenados 
na célula 8. 


6.2 Listas de nodos 


Usar um índice nào é a única maneira de se referir ao lugar onde um elemento aparece em uma 
sequência. Se existe uma sequência $ implementada sobre uma lista (simples ou duplamente) 
encadeada, então é mais natural e eficiente usar um nodo em vez de um índice como forma de 
identificar onde acessar ou atualizar essa lista. Nesta seção, define-se o TAD lista de nodos, que 
abstrair à estrutura de dados concreta em uma lista encadeada (Seções 3,2 e 3.3) usando um TAD 
com posições relativas que abstrai à conceito de “lugar” em uma lista de nodos, 


6.2.1 Operações baseadas em nodos 


Seja 5 uma lista (simplesmente ou duplamente) encadeada, Gostaria-se de definir métodos para 
$ que recebessem nodos da lista como parâmetros e que resultassem como tipo de retorno. Tais 
métodos poderiam ser sigmficativamente mais rápidos em relação a métodos baseados em indi- 
ces para localizar um elemento em uma lista encadeada, pois para localizar um elemento em uma 
lista encadeada € necessário pesquisar através da mesma de forma incremental a partir do início 
ou fim, contando os elementos à medida que se avança. 
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Como exemplo, pode-se definir um método hipotético remave(v), que remove o elemento de 
5 armazenado no nodo v da lista. Usar à nodo como parámetro permite remover o elemento em 
tempo OCL) simplesmente indo direto ao lugar onde o nodo está armazenado e, então, desconec- 
tando-o da lista através de uma atualização dos campos next e prev de seus vizinhos. Da mesma 
forma, pode-se inserir, em tempo OC), um elemento novo e em 5 com uma operação tal como 
addAfter( v.e), que especifica o nodo у depois do qual o novo elemento deve ser inserido. Neste 
caso, apenas se encadera o nodo novo. 

Definir os métodos de um TAD lista acrescentando operações baseadas em nodos, reforça a 
questão relativa à quanta informação sobre a implementação da lista pode ser exposta. Certamen- 
te é desejável ser capaz de usar tanto uma lista simples, como duplamente encadeada, sem revelar 
estes detalhes para o usuário, Por outro lado, não seria desejável que o usuário modificasse a 
estrutura interna da lista. Tais modificações seram possíveis, entretanto, se Fosse passada para o 
usuário uma referência para um nodo da lista, de forma que o mesmo tivesse acesso à estrutura 
interna do nodo (Lars como os campos next ou prev). 

Para abstrair e unificar diferentes formas de armazenar elementos nas possíveis implemen- 
tações de uma lista, introduz-se o conceito de posição, formalizando a noção intuitiva de “lugar” 
de um elemento em relação aos outros na lista, 


6.2.2 


Posições 


Para expandir de forma segura o conjunto de operações sobre listas, abstrai-se а noção de “po- 
sição”, o que permite aproveitar a eficiência de implementações baseadas em listas simples ou 
duplamente encadeadas, sem violar os princípios de projeto orientado a objetos. Neste esquema, 
vê-se uma lista como um repositório de elementos armazenados em posições que são mantidas 
organizadas em uma ordem linear. Uma posição também é um tipo abstrato de dados que suporta 
o seguinte método simples: 


elementi ; Retorna o elemento armazenado nesta posição. 


Uma posição é sempre definida de forma relativa, isto é, em relação aos vizinhos. Em uma 
lista, uma posição p estará sempre “depois” de uma posição q e “antes” de uma posição s (a 
menos que p seja a primeira ou a última posição). Uma posição p, associada com um elemento 
e em uma lista 5, não se altera mesmo se o indice de e se modificar em S, à menos que e seja 
explicitamente removido (destruindo a posição p). Por outro lado, a posição p não se modifica, 
mesmo quando se substitui ou se permuta o elemento e armazenado em p por outro. Esses fatos 
permitem definir um conjunto rico de métodos de lista bascados em posições que as recebem dos 
objetos como parámetro e fornecem objetos de posição como valores de retorno. 


6.2.3 


O tipo abstrato de dados lista de nodos 


Usando o conceito de posição para encapsular a idéia de “nodo” em uma lista, pode-se definir 
outro tipo de TAD sequência chamado de TAD lista de nodos. Este TAD suporta os seguintes 
métodos para uma lista 5: 


first): Retoma а posição do primeiro elemento de $; ocorre um erro se $ está 
vazio. 


last[): Retorna a posição do último elemento de 5; ocorre um erro se 5 está 
važi. 
previpi: Retorna a posição do elemento de 5 que precede о que se encontra na 
posição p; ocorre um emo se p for a primeira posição. 
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nextíp) Retorna a posição do elemento de 5 que segue o que se encontra na 
posição p; ocorre um erro se p for a última posição. 

Os métodos acima permitem fazer referência a posições relativas de uma lista, começan- 
do no inicio ou no fim e deslocando-se por incremento para cima ou para baixo. As posições 
podem ser intuitivamente entendidas como sendo os nodos da lista, porém, observa-se que 
não existem referências específicas a objetos nodo. Além do mais, se for fornecida uma po- 
sição como argumento para um método da lista, então ela deverá representar uma posição 
válida da lista. 


Métodos de atualização de uma lista de nodos 


Além dos métodos listados e dos genéricos size e isEmpty. o TAD lista inclui, também, os se- 
guintes métodos de atualização que recebem um objeto posição como parâmetro e/ou fornecem 
objetos posição como valores de retorno, 


set(p.e): Substitui o elemento que se encontra na posição p por e, retornando o 
elemento que se encontrava antes na posição p. 
addFirst(e): [nsere o novo elemento e em 5 como primeiro elemento. 
addLast(e) Insere o novo elemento e em 5 como último elemento. 
addBefore(e): Insere um novo elemento e em $ antes da posição p. 
addAfter(e): Insere um novo elemento e em $ depois da posição р. 
remove(p): Remove e retoma o elemento na posição p de 5, invalidando esta posi- 
ção de 5. 


O TAD lista de nodos permite que se entenda uma coleção ordenada de objetos em função 
de seus lugares, sem se preocupar com a maneira exata pela qual esses locais são representados 
(ver Figura 6.5). 


Baltimore E Nova York 


p g r 5 


Figura 6.5 Uma lista de nodos. Às posições na ordem atual são р, q. res. 


Em um primeiro momento, parece haver redundância no repertório de operações do TAD 
lista de nodos, uma vez que se pode executar a operação addFirst(e), usando addBeltore(first( ),e) 
c a operação addLast(e), usando addAftenr(getLast( ).e). Mas essas subsliluições só podem ser 
feitas para uma lista não-vazia. 

Observa-se que uma condição de erro ocorre se uma posição passada por parâmetro para 
uma das operações da lista for inválida. As razões que podem levar uma posição a ser inválida 
incluem: 


* p= null 

«+ р foi previamente eliminado da lista 

* péuma posição de uma lista diferente. 

* péa primeira posição da lista e chama-se prev(p) 
a péaúltima posição da lista e chama-se next(p). 


As operações de um TAD lista de nodos são demonstradas no exemplo que segue. 
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Exemplo 6.3 Apresenta-se na segitência uma série de operações sobre uma lista $ inicialmente 
vazia. Usam-se as varidveis pp p,, € assim por diante, para denotar as diferentes posições, e 
identifica-se o objeto atualmente armazenado em tal posição entre parênieses, 


| Operação Saída 5 
addFirst(8) (8) 
first ( ) (8) 
addAfter (py, 5) (8,5) 
naxt(m) | (8,5) 


addBefore (ps, 3) (8,3,5) 
prev( pa) (8,3,5) 
addFirst(9) (9,8,3,5) 
lasti ) (9,8,3,5) 
remove (first ( )) i | (8,3,5) 
Зе m. 7) E (8,7,5) 
| addAfter (first( ), 2 (8,2,7,5) 


O TAD lista de nodos, com sua idéia de posição embutida, é útil em um grande número de 
configurações. Por exemplo, um programa que modele várias pessoas jogando cartas pode repre- 
sentar a mão de cada jogador como uma lista de nodos, Uma vez que a maioria das pessoas gosta 
de manter as cartas do mesmo naipe juntas, inserir e remover as cartas da mão de uma pessoa 
pode ser implementado usando os métodos do TAD lista de nodos, com as posições sendo deter- 
minadas pela ordem natural dos naipes. De forma semelhante, um simples editor de texto embute 
a noção de inserção e remoção baseadas em posição, uma vez que normalmente os editores exe- 
cutam suas operações relativas a um cursor, que representa a posição atual na lista dos caracteres 
do texto que está sendo editado, 

Uma interface Java representando o TAD posição é apresentada no Trecho de código 6.4. 
public interface Position<E> { 

/** Retorna o elemento armazenado nesta posição. */ 
E elementi |; 
| 


Trecho de código 6.4 Interface Java do TAD posição. 


Uma interface para o TAD lista de nodos, chamada PositionList, é fornecida no Trecho de 
código 6.5. Essa interface usa as seguintes exceções para indicar condições de erro. 


BoundaryViolationException: lançada se for feita uma tentativa de acessar um elemento cuja po- 
sição esta fora do intervalo de posições da lista (por exemplo, cha- 
mando-se o método next sobre a última posição da seqiiéncia). 


InvalidPositionException: lançada se a posição fornecida como argumento não é válida (por 
exemplo, se é uma referência nula ou não tem lista associada). 


public interface PositionList=E=[ 
/** Retorna o número de elementos desta lista. */ 
public int size( |; 
/** Retorna quando a lista está vazia. */ 
public boolean isEmpty( ); 
/** Retorna o primeiro nodo da lista. */ 
public Position Е firsti y; 
/** Retorna o ültimo nodo da lista. */ 
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public Position<E> kasti ); 
+ Retoma o nodo que segue um dado nodo da lista. */ 
public Position -E-- next(Position-E-- p) 
throws InvalidPositionException, BoundaryViolationÊxception; 
/** Retorna o nodo que antecede um dado nodo da lista. */ 
public Position -E- prev(Position--E- p) 
throws InvalidPositionException, BoundaryWiolationException; 
+ nsere um elemento no inicia da lista, retornando uma posição nova. */ 
public void addFirstiE e); 
4 Insere um elemento na última posição, retornando uma posição nova */ 
public void addLastE e); 
/** Insere um elemento após um dado elemento da lista, */ 
public void addAfter(Position<E> p, E e) 
throws InvalidPositionÊxception; 
/** |nsere um elemento antes de um dado elemento da lista, */ 
public void addBefore(Position-E- p, E e) 
throws InvalidPasitionException; 
/** Remove um nodo da lista, retornando o elemento là armazenado */ 
public E remove(Position--E-- p) throws InvalidPositionException; 
/** Substitui o elemento armazenado em um determinado nodo, retornando o elamento que 
estava lá armazenado */ 
public E set(Position--E- p, E e) throws InvalidPositionException; 


Trecho de código 6.5 Interface de Java para o TAD lista de nodos 


Outro adaptador de deque 


Com respeito à discussão relativa ao TAD lista de nodos, observa-se que este TAD é suficiente 
para definir uma classe adaptadora para o TAD deque, como se pode ver na Tabela 6.3. 


Método do deque “Implementação com métodos da lista nodo 
size(), isEmpty() | size(), isEmpty() NES 
getFirst ) firsti ).elernentí ) 

getLast() last | element | 

addFirstie) addFirstie 

addLastie) addLastie) 

removeFirst ) removelfirstl j} | 
removeLast() remove(last( j) | 


Tabela 6.3 Implementação de um deque usando uma lista nodo, 


6.2.4 Implementação usando lista duplamente encadeada 


Supondo que se deseja implementar um TAD lista, baseado em uma lista duplamente encade- 
ada (Seção 3.3), pode-se simplesmente fazer com que os nodos da lista implementem o TAD 
posição. Isto é, cada nodo implementa a interface Position e, por consequência, um método 
chamado element(), que retorna o elemento armazenado no nodo, Assim, os próprios nodos 
atuam como posições. Eles são vistos internamente pela lista encadeada como nodos, mas do 
ponto de vista externo são vistos apenas como posições. Do ponto de vista interno, cada nodo 
v tem as variáveis de instäncia prev e next, que se referem, respectivamente, aos nodos ante- 
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cessor e sucessor de v (que podem, de fato, ser os nodos sentinela inicial ou final, que marcam 
o início e o fim da lista). Em vez de usar as variáveis prev e next diretamente, definem-se os 
métodos getPrev, setPrev, getNext e setNext para o nodo, de maneira a acessar e modificar 
estas variáveis, 

No Trecho de código 6.6, apresenta-se a classe Java DNode para os nodos de uma lista 
duplamente encadeada que implementa o TAD posição, Essa classe é similar à classe DNode, 
apresentada no Trecho de código 3.17, exceto porque agora os nodos armazenam um elemento 
genérico em vez de uma string. Observa-se que as variáveis de instância prev e next desta classe 
são referências privadas para outros objetos DNode, 


public class DNode<E> implements Position<E> { 
private DNode<E-= prev, next; /! Referencia para os nodos anterior e posterior 
private E element; — // Elemento armazenado nesta posição 
“e Construtor */ 
public DNode(DHode<E=- newPrew, DMode--E-- newMext, E elem) | 
prev = newP rey, 
next = newMext; 
element = elem; 
} 
¿Método da interface Position 
public E elementi ) throws InvalidPositionException { 
if (prev == null) && (next == null) 
throw new InvalidPosittonExcepton(*Fosition is not in a list! "|; 
return element; 
} 
// Métodos de acesso 
public DMode--E-- getMext( | [ return next; ] 
public Dode--E- getPrevi ) | return prev; } 
// Métodos de atualização 
public void setMext(DMode--E- newMext) [ next = newMext; | 
public void setPreviDNode-- Ë> newPrev) ( prev = newPrev; } 
public void setElement( E newElement) { element = newElement, } 
} 


Trecho de código 6.6 Classe DNode representando um nodo de uma lista duplamente encade- 
ada que implementa a interface Position (TAD). 


Dada uma posição p em $, pode-se ^desempacotar" p para revelar o nodo v, Isso é possível 
convertendo a posição para um nodo, Uma vez que se tem um nodo v, pode-se, por exemplo, im- 
plementar o método prev(p). usando v.getPrewi ) (a menos que o nodo retornado por v.getPreví ) 
seja o nodo inicial, caso em que se sinaliza um erro). Conseqüentemente, posições em uma lista 
duplamente encadeada podem ser suportadas em um estilo orientado a objetos sem necessidade 
de tempo ou espago adicional. 

Considere-se, a seguir, como se pode implementar o método addAfter(p.e) para inserir um 
elemento e depois da posição p. Da mesma forma que discutido na Seção 3.3.1, cria-sé um novo 
nodo v para abrigar o elemento e, liga-se v no seu lugar da lista, e então atualizam-se as referén- 
cias next e prev de v com seus novos vizinhos. Este método é apresentado no Trecho de código 
6.7 e ilustrado (novamente) na Figura 6.6. Lembrando o uso das sentinelas (Seção 3.3), observa- 
$e que este algoritmo funciona mesmo se p for a última posição real. 


Algoritmo addäfter(p,e}: 
Cria um nodo novo e 
v.setElemoenti e) 
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v.setPrevip) conecta v com seu antecessor | 

v.setNextíp.getMend( |) | conecta v com seu sucessor | 
(p.getNext( )).setPrev(v) [conecta o antigo sucessor de v com p] 
p.setMext(v) [conecta p com seu novo sucessor, v] 


Trecho de código 6.7 Inserção de um elemento e após uma posição p em uma lista encadeada. 


header | mE trailer 
LRE K JE 
(а) 
haader trailer 
2% [He [vo [pero | | 
| | 
WESEN 
(hi 
header trailer 
ESSES em IK RAS [sro [Ae | 
(c) 


Figura 6.6 — Acrescentando um novo nodo após a posição “JFK” (a) antes da inserção; (b) eria- 
ção do novo nodo v com o elemento “BWI” e concatenagáo do mesmo; (c) após a inserção. 


Os algoritmos para os métodos addBefore, addFirst e addLast são similares aos do método 
addAfter. O detalhamento fica para o Exercício R-6.5. 

A seguir, considera-se o método remove(p), que remove o elemento e armazenado na posi- 
ção p. Da mesma forma que apresentado na Seção 3.3.2, para executar essa operação, conectam- 
se os dois vizinhos de p de maneira que os mesmos se referenciem entre si como novos vizinhos 
- desconectando p. Observa-se que depois que p é desconectado, nenhum nodo estará apontando 
para o mesmo, logo o sistema de coleta de lixo pode recuperar o espaço de p. Este algoritmo é 
apresentado no Trecho de código 6.8 e representado na Figura 6.7. Lembrando o uso de senti- 
nelas, salienta-se que este algoritmo trabalha mesmo que p seja à primeira, a última ou à única 
posição real da lista, 


Algoritmo removeip): 


г< p.element [uma variável temporária para abrigar o valor de retorno] 
(p.getPrev( h setNextip.getNext( }у [desconectando п} 

(p.getNext( )).setPrev(p.getPrev( )) 

p.setPrevinull) [invalidando a posição p] 

p.setNextinull) 

return é 


Trecho de código 6.8 Removendo um elemento e armazenado na posição p de uma lista 
encadeada. 


Concluindo, usando uma lista duplamente encadeada, podem ser executados todos os méto- 
dos do TAD lista em tempo O (1). Logo, uma lista duplamente encadeada é uma implementação 


eficiente do TAD lista, 
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header tralbar 
| uw As | BWI | en 78, | жк | s a SFO Kon = | 
(c) 


Figura 6.7 Removendo a objeto armazenado na posição “PVD”: (a) antes da remoção; (Б) des- 
conectando o nodo velho: (e) depois da remoção (e da coleta de lixo). 


Implementação de uma lista de nodos em Java 


Partes do código da classe Java NodePositionList, que implementa o TAD lista de nodos usan- 
do uma lista duplamente encadeada, são apresentadas nos Trechos de código 6.9-6.11. O Tre- 
cho de código 6.9 apresenta as variáveis de instância de NodePositionList, seu construtor, € o 
método checkPosition, que executa algumas verificações de segurança e “desempacota” uma 
posição, convertendo-a novamente em um objeto DNode, O Trecho de código 6.10 apresenta 
métodos de acesso e atualização adicionais. O Trecho de código 6.11 apresenta métodos de 
atualização adicionais. 
public class NodePositionList<E> implements PositionList<E> | 

protected int numElts; ¿Número de elementos na lista 

protected Dhode<E> header, trailer; // Sentinelas especiais 

/** Construtor que cria uma lista vazia; tempo O(1) */ 

public NodePositionList | { 

numelts = 0; 

header = new ÖNode<E->(null, null, null); ¿Feria a cabaça 

trailer = new DNode=<E>=(header, null, null); // cria a cauda 

header. setNextitraller); ff faz a cabeça e a cauda apontarem um para o outro 


FEE Verifica se a posição е válida para esta lista e a converte para 
* DMode se for válida; tempo C1) +, 

protected DNode--E-- checkPosition(Position<E > р) 
throws InvalidPositionException | 


if (p == null) 
throw new InvalidPositionException 
("Null position passed to NodeList") 
if (p == header) 
throw new InvalidPositionExceptian 
("The header node is not a valid position"); 


if ip == trailer) 
throw new InvalidPositionException 
("The trailer node is not a valid position") 


try | 
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DHode--E-- temp = [DNode<E>) px 
if ((temp.getPrev() == null) || (temp.getNext( ) == null) 
throw new InvalidPositionException 
("Position does not belong to a valid HodeList*); 
return temp; 
1 catch (ClassCastException е) ( 
throw new InvalidPositionException 
("Position is of wrong type for this liste) 
] 
| 


Trecho de código 6.9 Partes da implementação da classe NodePositionList que implementam 
o TAD lista de nodos usando uma lista duplamente encadeada, (Continua nos Trechos de código 
6.10 е 6.11.) 


/** Retorna a quantidade de elementos па lista; tempo 0/1) */ 
public int size( ) ( return numElts; } 
/** Retorna quando a lista esta vazia; tempo O(1) */ 
public boolean isEmpty() [ return (numElts == 0); } 
/** Retoma a primeira posição da lista; tempo Q(1) */ 
public Position <E> firsti} 
throws EmptyListException [ 
if isEmpty( )) 
throw new EmptyListExceptioni"List is empty"); 
return header. getNext( |; 
| 
J/** Retorna a posição que antecede a fornecida; tempo Of) */ 
public Position=E = previPosition<E= р) 
throws InvalidPositionException, BoundaryWiolationException ( 
DNode<E> v = checkPositionp): 
DHode-E- prev = vgetPrevl E 
if (prev == header) 
throw new BoundaryVialationÊxception 
("Cannot advance past the beginning of the list"); 
return prev; 


Pe Insere o elemento antes da posição fornecida, retornando 
+ anova posição, tempo O(1) */ 
public void addBeforelPosition<E> p, E element) 


throws InvalidPositionException { Ш 
Diode<E= v = checkPosition(pl; 
numElts++; 


DNode--E- newNode = new DNode=E=>(v.getPrev(), v, element) 
v.getPrev( .setNextinewNode); 
v.setPrevinewMode); 

| 


Trecho de código 6.10 Partes da implementação da classe NodePositionList que implementam 
o TAD lista de nodos usando uma lista duplamente encadeada. (Continuação do Trecho de códi- 
go 6.9. Continua no Trecho de código 6.11.) 


/** Insere o elemento dado по inicio da lista, retomando 
* anova posição; tempo 041) */ 

public void addFirstiE element) { 
rumElts+ +; 
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DNade-E- newMode = new DhNode-E- (header, header. getNext( |, element); 
header getNext ).setPrevinewNode); 
header.setMext(newNoda); 
} 
/**Remove da lista a posição fornecida; tempo ОТ */ 
public E remove(Position<=E= р) 
throws InvalidPositionException | 
DMode-cE-- v = checkPositiondp): 
numElts— — ; 
ОМоде= Е vPrev = v.getPreví | 
DMode--E- vMext = vgetNext |); 
vPrev.setMextivMext); 
vNext.setPrevivPrev) 
E vElem = v.elementí ); 
## Desconecta a posição da lista e marca-a como inválida 
v.setNextinull); 
v.setPrevinull) 
return vElem; 


} 
/** Substitui o elemento da posição fornecida por um novo 
* e retoma o elemento velho; tempo O(1) */ 
public E set(Position<E> p, E element) 
throws InvalidPositionException { 
DNode<E> v = checkPosition(p): 
E oldElt = v.elermenti); 
v.setElement(elemoent): 
return oldElt; 


] 


Trecho de código 6.11 Partes da classe NodePositionList que implementam o TAD lista de 
nodos usando uma lista duplamente encadeada. (Continuação dos Trechos de código 6.9 e 6.10.) 
Observa-se que o mecanismo usado para tornar inválida uma posição no método remove é con- 
sistente com aquele utilizado nas verificações da função de conveniência checkPosition. 


Tr A жет —т——— 


6.3  Iteradores 


Uma operação tipica sobre um vetor, uma lista ou uma segliäncia é percorrer seus elementos em 
ordem, um de cada vez, para, por exemplo, procurar um elemento específico. 


6.3.1 Os tipos abstratos de dados iterador e iterável 


Um iterador é um padrão de projeto de software que abstrai o processo de busca sobre uma 
coleção de elementos, um de cada vez. Um iterador consiste em uma seqüéncia 5, um elemento 
corrente de 5 e uma forma de avançar para o próximo elemento de 5, tornando-o o elemento cor- 
rente, Logo, um iterador estende o conceito do TAD posição, introduzido na Seção 6.2. De fato, 
uma posição pode ser entendida como um iterador que não é capaz de se deslocar, Um iterador 
encapsula os conceitos de “lugar” e “próximo” em uma coleção de objetos. 

Define-se o TAD iterador como suportando os dois métodos que seguem: 


hasMext Testa a existência de elementos remanescentes no iterador, 


nextObject: Retorna o próximo elemento do iterador. 
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Observa-se que o TAD iterador usa a noção de elemento corrente quando percorre uma se- 
quência. O primeiro elemento de um iterador é fornecido pela primeira chamada ao método next, 
supôndo, é claro, que o iterador contenha pelo menos um elemento. 

Um iterador oferece um esquema unificado para acessar todos os elementos de uma coleção 
de objetos de uma forma independente da organização interna da coleção, Um iterador para uma 
lista arranjo. lista ou seqúéncia deve retornar os elementos de acordo com sua ordenação linear. 


Iteradores simples em Java 


Java fornece um iterador através de sua interface java util Iterator. Observa-se que a classe java. 
util.Scanner (Seção 1.6) implementa esta interface. Esta interface suporta um método adicional 
(opcional) para remover da coleção elementos previamente retornados. Essa funcionalidade (re- 
moção de elementos por meio de um iterador) é bastante controversa do ponto de vista de orien- 
tação à objetos; logo, não é de surpreender que sua implementação por classes seja opcional. 
Java também oferece a interface java util. Enumeration, historicamente mais antiga que a interface 
erator, e que usa os nomes hasMoreElements( ) e nextElement( ). 


О tipo abstrato de dados iterável 


Com o objetivo de fornecer um mecanismo genérico unificado para percorrer uma estrutura de 
dados, os TADs que armazenam coleções de objetos devem suportar o seguinte método: 


iterator( }: Retorna um iterador para os elementos da coleção, 


Esse método é oferecido pela interface java.util.ArrayList. Na verdade, este método é tão 
importante, que existe uma interface inteira, jàva.lang.Iterable, que contém apenas este método, 
Este método torna simples especificar computações que necessitem percorrer os elementos de 
uma lista. Para garantir que a lista suporta os métodos anteriores, por exemplo, pode-se adicionar 
este método à interface PositionList, como mostrado no Trecho de código 6.12. Neste caso, pode- 
se querer também declarar que PositionList estende Îterable. Conseqiientemente, assume-se que 
as listas arranjo e as listas de nodos suportam o método iterator] ). 


public interface PositionList<E> extends Iterable-=E = T 
Af, todos os outros métodos do TAD lista . . . 
F** Retorna um iterador sobre todos os elementos da lista, */ 
public Herator=E > iteratorí |; 

} 


Trecho de código 6.12 Acrescentando o método iterator na interface PositionList. 


Fornecida tal detinição para PositionList, pode-se usar o iterador retornado pelo método iterator | 
para criar uma representação string da lista de nodos, como mostrado no Trecho de código 6.13. 


/** Retorna a representação textual de uma lista de nodos */ 
public static <E> String toString(PositianList E = I) f 
lterator--E- it = Literatarí ); 
String a = "["; 
while {t has Next |) { 
в += tnext i 4 coerção implicita do próximo elemento para uma string 
if (it.hasNexti |) 


Sx н, +; 
| 

s += "jr; 
return s; 


! 


Trecho de código 6.13 Exemplo de iterador Java usado para converter uma lista de nodos em 
uma string. 
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6.3.2 


O lago de Java para-cada 


Uma vez que executar um laço sobre os elementos retornados por um iterador é uma construção 
muito comum, Java provê uma notação simplificada para tais laços, chamada de laço para-cada. 
А sintaxe de tal laço é a que segue: 


for (Tipo nome : expressão) 
comandos do laço 


onde expressão corresponde a uma coleção que implementa a interface java. lang.itarable, Tipo 
é o tipo do objeto retornado pelo iterador desta classe e nome é o nome de uma variável que irá 
receber os valores dos elementos deste iterador nos comandos do lago, Esta notação é apenas 
uma simplificação do que segue: 


for (Iterator= Tipo > it = expressão iterator( y; it.hasNext(); ) | 
Type name = tnext j; 
comandos de lago 


| 


Por exemplo, se existe uma lista, values, de objetos Integer, e values implementa java.lang. 
iterable, então se podem somar todos os inteiros de values da seguinte forma: 


List= Integer => values; 
ії... comandos que criam uma nova lista de valores e a preenchem com Integers . . . 
int sum = 0; 
for (Integer i : values) 
sum +=i; {unboxing permite isso 


Pode-se ler o laço acima como "para cada inteiro i em values, execute o corpo do laço” (nes- 
te caso, somar é em sum). 

Além desta forma de laço recém descrita, Java também permite que laços para-cada sejam 
definidos quando a expressão é um arranjo do tipo Tipo, o qual, neste caso, pode ser tanto um tipo 
base como um objeto. Por exemplo, podem-se totalizar os inteiros de um arranjo, v, que armaze- 
na os primeiros dez inteiros positivos como segue: 


inti ] v = fl, 2, 3, 4, 5, 6, 7, 8, 9, 10]; 
int total = 0; 
for (int i : v) 

total += i; 


6.3.3 


Implementando iteradores 


Uma maneira de implementar um iterador para uma coleção de elementos é criar uma “foto” da 
coleção e iterar sobre a mesma. Esta abordagem irá envolver o armazenamento da coleção em 
uma estrutura de dados separada que suporte acesso segtiencial a seus elementos. Por exemplo, 
podem se inserir todos os elementos de uma coleção em uma pilha, caso em que o método has- 
Meti ) irá corresponder a lisEmpty( ). e next irá corresponder a enqueue( ). Usando esta aborda- 
gem, o método iterator( } irá consumir um tempo Oin) para uma coleção de tamanho n. Uma vez 
que o custo da cópia é relativamente alto, prefere-se, na maioria dos casos, fazer os iteradores 
operarem sobre a própria coleção, e não sobre uma cópia. 

Quando se implementa esta abordagem direta, é necessário apenas manter o ponto da coleção 
para onde o cursor do iterador aponta. Logo, criar um iterador novo, neste caso, envolve apenas à 
criação de um objeto iterador que represente um cursor posicionado antes do primeiro elemento 
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da coleção. Da mesma forma, executar o método next( | envolve o retorno do próximo elemento, 
se existir, e a movimentação do cursor para que deixe para trás a posição deste elemento. Assim, 
nesta abordagem, a criação de um iterador consome tempo O1). da mesma forma que cada um 
dos métodos do merador, Apresenta-se uma classe que implementa tal iterador no Trecho de că- 
digo 6.14 e no Trecho de código 6.15, e como este iterador pode ser usado para implementar o 
método iterator da classe NodePositionList. 


public class Elementlterator <E> implements Iterator<E> [ 
protected PositionList<E> list; ¿alista subjacente 
protected Position E> cursor, — //a próxima posição 
/** Cria o elemento iterador sobre a lista fornecida. */ 
public Elementiterator(PositionList=E> L) { 
list = L; 
cursor = (list.isEmpty{ jj null : list firsti y; 


public boolean hasMext( | { return (cursor != null); | 
public E next() throws NoSuchElementException ( 
if (cursor == null) 
throw new MoSuchElementException("No next element"); 
E toReturn = cursor.element( |; 
cursor = (cursor == list.last( jj! null : ist.nexticursor); 
return toReturn; 


Trecho de código 6.14 Classe de um elemento iterador para PositionL ist. 


** Retorna um iterador sobre todos os elementos da lista. */ 
public Iterator < E> iterator ) { return new Elementiterator-- E > (this); | 


Trecho de código 6.15 O método iterator da classe NodePositionL ist. 


Iteradores de posição 


Para os TADs que suportam a noção de posição, tais como os TADs lista e sequência, pode-se 
fornecer o seguinte método: 


positions(): retorna um objeto Iterable (tal como uma lista arranjo ou uma lista de 
nodos) contendo as posições da coleção como elementos. 


Um iterador retornado por este método permite que se percorram as posições de uma lista. 
"ara garantir que uma lista de nodos suporte este método, deve-se acrescentar à mesma а interfa- 
ce PositionList, como demonstrado no Trecho de código 6.16. Então, será possível, por exemplo, 
acrescentar a implementação deste método a NodePositionList, como mostrado no Trecho de 
código 6.17. Este método usa à própria classe NodePositionList para criar uma lista que contém 
as posições da lista original como seus elementos. Retomando esta lista de posições como um 
objeto Iterable, permite que se chame iterator ) sobre este objeto para obter um iterador sobre as 
posições da lista original, 
public interface PositionList=E > extends Iterable<E> I 
i todos os outros métodos do TAD lista 
‚++ Retorna uma colação iterável de todos os nodos da lista. */ 
public Iterable<Position<E> > positions ); 
| 


Trecho de código 6.16 Acrescentando o método iterador na interface PostionList. 
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PASA = A ——— — 


PER Retorna uma coleção бегаме! de todos os nodos da lista, */ 


public Iterable-- Position E- > positionel ) [ sí cria uma lista de posições 
PositionList=Position<E>=> Р = new ModePositionList Position < E> —( |; 
if ('isEmptyf Y { 
Position--E- р = first( |; 
while (true) | 
PaddLast(p); // acrescenta a posição p como último elemento da lista P 
if (p == last f) 
break; 
p = nextip): 
} 
} 


return P: retorna P como objeto iterável 
} 


Trecho de código 6.17 O método position ) da classe NodePositionList, 


O método iterador[ ) retornado por este e outros objetos Herable define um tipo restrito de 
iterador que permite apenas uma passagem sobre os elementos. Entretanto, iteradores mais pode- 
rosos também podem ser definidos, permitindo o deslocamento para frente e para trás sobre uma 
certa ordem de elementos, 


6.3.4 Iteradores de lista em Java 


А classe java.util.LinkedList não expõe o conceito de posição para os usuários de sua API, Em vez 
disso, a forma preferida de acessar e atualizar um objeto LinkedList em Java, sem usar indices, 
é usando um Listlterator, que é gerado pela lista encadeada através do método listiterator( ). Tal 
iterador permite que se percorra a lista para frente e para trás, bem como métodos de atualização. 
A posição comente é entendida como sendo antes do primeiro elemento, entre dois elementos ou 
depois do último elemento. Esto é, ela usa um cursor de lista, parecido com a maneira pela qual 
um cursor de tela é visto, localizado entre dois caracteres da tela. Mais especificamente, a inter- 
face Јама. Ш. Listiterator inclui os seguintes métodos, 


ае): acrescenta o elemento e na posição corrente do iterador 


hasMext(): True se e somente se existe um elemento após a posição corrente do 
iterador 


hasPreviaus( y Truc se c somente se existe um elemento antes da posição corrente do 
iterador 
previous): retoma o elemento e que antecede a posição corrente e laz com que а 
posição corrente seja a que antecede e 
next() retorna o elemento e que sucede a posição corrente e faz com que a 
posição corrente seja a que sucede e 
nextindex(): retorna o indice do próximo elemento 
previousIndexi | retorna o indice do elemento anterior 


setie): substitut o elemento retornado pela última operação next ou previous 
por e 


emei) remove o elemento retomado pela última operação next ou previous 


E um risco usar vários iteradores sobre a mesma lista enquanto se modifica seu conteúdo, Se 
inserções, deleções ou substituições são requeridas em vários “lugares” de uma lista, é mais se- 
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euro usar posições para especificar estas localizações. Mas a classe java util LinkedList não expõe 
seus objetos posição para o usuário. Assim, para evitar o risco de modificar uma lista que tenha 
criado vários iteradores (através de chamadas para seu método iterator( )), os objetos java.util. 
Itarator tem um recurso de “talha rápida”, que imediatamente invalida um iterador se a coleção 
subjacente for modificada de forma inesperada. Por exemplo, se um objeto Java. utii. LinkedList 
L retomou cinco Iteradores diferentes, e um deles modifica L, então os outros quatro se tornam 
imediatamente inválidos. [sto é, Java permite que vários ieradores de lista estejam percorrendo 
uma lista encadeada L ao mesmo tempo, mas se um deles modifica L (usando os métodos add, 
set ou remove), então todos os demais iteradores sobre L se tornam inválidos. Da mesma forma, 
se Lé modificado por um de seus próprios métodos de atualização, então todos os iteradores 
existentes para L imediatamente se tornam inválidos. 


А interface java.util List e sua implementação 


Java provê funcionalidades semelhantes aos TADs lista e lista de nodos na interface Java. util. 
List, que é implementada usando-se arranjos em java.util.ArrayList e empregando uma lista en- 
cadeada em java.util.LinkedList. Existem alguns problemas com estas duas implementações que 
são explorados com maior profundidade na próxima seção. Além disso, Java usa iteradores para 
obter uma funcionalidade similar aquela que o TAD lista deriva a partir das posições. À Tabela 
6,4 mostra os métodos correspondentes entre os TADs de lista (arranjo € de nodos) e as interfaces 
java.util, List e Listiterator, com observações a respeito de suas implementações nas classes java. 
util ArrayList e java.util.LinkedList. 


6.4 Os TADs de lista e o framework de coleções 


Nesta seção, discutem-se TADs de listas genéricos, que combinam os métodos dos TADs degue, 
lista arranjo e ou lista de nodos. Antes de descrever tais TADs, apresenta-se o contexto no qual 
estão inseridos. 


6.4.1 О framework de coleções do Java 


Java fornece um pacote de interfaces e classes de estruturas de dados que, em conjunto, definem 
o framework de coleções de Java. Este pacote, java uti, inclui versões de várias das estruturas de 
dados discutidas neste livro, algumas das quais já foram apresentadas e outras que serão discuti- 
das no restante do livro. Em especial, o pacote java.util inclui as seguintes interfaces: 


Collection: uma interface genérica para qualquer estrutura de dados que contenha 
uma coleção de elementos, Estende java.lang.Iterable: logo, inclui o mé- 
todo iterator }, que retorna um iterador sobre os elementos da coleção. 


iterator: uma interface para o TAD iterador simples. 
List: uma interface que estende Collection para incluir o arranjo do TAD 
lista. Também inclu um método listlterator para retornar um objeto 
Listltarator para esta lista. 

Listlterator: interface de iterador que permite tanto caminhamento para frente como 
para trás sobre uma lista, bem como métodos de atualização baseados 
em cursor. 

Map: uma interface para mapear chaves para valores. Este conceito e interfa- 
ce são discutidos na Seção 9.1. 
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di Lista java. util List Listlterator 
stel) | skel) | | Tempo 
em | атру [Tempo 


get (i) get (1) 


first () listiterator( ) 


из) | fsUterator(sze() | | Ойы 
rewi p ) previous). Tempo (41) 


лец) | — вно) | Tempo 000 
ae | [юе | 


setii, e} setii, e) A&O. NE 
E é Oimin[i, л = i]) 


addi, e) addi, e) Tempo On) 


remove (7) remove (7) AEO), — 
L é стт n — i]) 


addFirst(e) addi, e) —— — A É On), LE OCD 


adadrirst i e ) adaFirst (e) Existe apenas em L. CMT) 
addLast (e) ——— Tempo #01) 


| addlastíe) | | addlastíe) | addLast (е) Existe apenas em L. Hl) 


addAfter( р, е} A inserção é na posição do cursor; 
A é Om), L é CM) 


addBetore( n. е) A inserção é na posição do cursor; 
A é Om, E é CUI) 
remove (p) OO T n A remoção é na posição do cursor; 
A é On), Léo) 
Tabela 6.4 — Correspondência entre os métodos dos TADs lista arranjo e lista de nodos, e as in- 
terfaces de java.util, List e Listlterator. Usa-se А e L como abreviatura de java util. ArrayList e java. 
util. LinkedList (ou seus tempos de execução). 


Queue: Uma interface para o TAD fila, mas usando métodos com nomes dife- 
rentes. Os métodos incluem peek( ) (o mesmo que fronti jb, affer(e) (o 
mesmo que enqueva(e)) e ро! ), o mesmo que dequeuel )). 


Set. uma interface que estende Collection para conjuntos. 


O framework de coleções de Java também inclui várias classes concretas, implementando 
várias combinações das interfaces acima. Em vez de se colocar aqui uma lista de cada uma destas 
classes, elas serão discutidas em locais mais apropriados deste livro. Um tópico que se deseja 
esgotar agora, porém, é que qualquer classe que implementa a interface java.util. Collection tam- 
bém implementa a interface java lang herable, assim, ela inclui um método iterator, e pode ser 
usada em um laço para-cada. Além disso, qualquer classe que implementa a interface java.util. 
List também inclui o método listiterator. Como observado anteriormente, tais interfaces são úteis 
рага se percorrer os elementos de uma coleção ou lista 
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6.4.2  Aclasse java.util.LinkedList 


A classe java.util.LinkedList contém vários métodos, incluindo todos os métodos do TAD deque 
(Seção 5,3) e todos os métodos do TAD lista arranjo (Seção 6.1). Além disso, como mencionado 
anteriormente, ele também oferece funcionalidades similares àquelas do TAD lista de nodos por 
meio do uso de seu iterador de lista. 


Performance da classe java.util.LinkedList 


A documentação da classe java util LinkedList torna claro que esta classe é implementada usan- 
do-se uma lista duplamente encadeada, Assim, todos os métodos de atualização do iterador de 
lista associado executam em tempo O(1). Da mesma forma, todos os métodos do TAD deque 
também executam em Є 1), uma vez que envolvem apenas a atualização ou consulta da lista em 
seus extremos, Mas os métodos do TAD lista arranjo também estão incluídos em java util.Linke- 
dList e, em geral, não são adequados para uma implementação baseada em listas duplamente 
encadeadas. 

Em especial, uma vez que uma lista encadeada não permite o acesso indexado a seus ele- 
mentos, executar a operação getii), para retornar o elemento de índice i, requer que se percorra 
toda а lista a partir de uma das extremidades, contando para cima ou para baixo, até encontrar o 
nodo que armazena o elemento de Índice i. Uma otimização superficial seria começar a busca a 
partir da extremidade mais próxima da lista, obtendo então um tempo de execução que é 


O(minti 1, п— у), 
onde n é a quantidade de elementos na lista. O pior caso para este tipo de pesquisa ocorre quando 
F= leal 
Assim, o tempo de execução permanece Cin}. 
As operações addi i.e) e remove() também devem promover uma busca para localizar o nodo 


armazenando o elemento de índice í, e então inserir ou deletar um nodo, Os tempos de execução 
destas implementações de абат, е} e remove(r) são da mesma forma 


mingit 1, —¿+1), 


o que é Or}. Uma vantagem desta abordagem é que se | = Doui = n— 1, como é o caso na adap- 
tação do TAD lista arranjo para o TAD deque apresentado na Seção 6.1.1, então add e remove 
executam em tempo Of 1). Mas, em geral é ineficiente usar os métodos de uma lista arranjo com 
um objeto java util LinkedList. 


8.4.3  Sequências 


Uma sequência é um TAD que suporta todos os métodos do TAD deque (Seção 5.3) e do TAD 
lista arranjo (Seção 6.11. Ou seja, fornece acesso explícito aos elementos da lista, tanto por seus 
indices como por suas posições. Além disso, por ter essa dupla capacidade, também foram inclui- 
dos dois métodos de “transição” que relacionam colocações € posições: 
atindexirk Retorna a posição do elemento de índice i; uma condição de erro ocorre 
se iO ou i > size) — |. 


indexOf pd: Retorna o índice do elemento na posição р, 
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Herança múltipla no TAD sequência 


A definição do TAD sequência, incluindo todos os métodos de três TADs diferentes, € um exem- 
plo de herança multipla (Seção 2.4.2). Ou seja, о TAD sequência herda métodos de trés outros 
ТАП “ancestrais”. Em outras palavras, seus métodos incluem a união dos métodos de seus 
TADs “ancestrais”, Veja o Trecho de código 6.18 pará uma especificação Java do TAD seqüéncia 
como uma interface Java. 


[тт 
* Interface para uma sequência, uma estrutura de dados que suporta 
* todas as operações de um deque, lista indexada e lista de posições. 
+y 
public interface Sequence= E-— 
extends Deque-- E =, IndexList=E =, PositionList-- E — 1 
/** Retorna à posição contendo o elemento em um dado indice. */ 
public Position-—E = atindex(im r) throws BoundaryViolationException; 
FE Retorna o indice do elemento armazenado em uma determinada posição. */ 
public int indexOf(Position-E- p) throws InvalidPositianException; 
] 
Trecho de código 6.18 A interface sequência definida usando-se herança múltipla. Inclui todos 
os métodos das interfaces Deque, IndexList e PositionList (definidas para qualquer tipo genérico 
El, € tem dois métodos adicionais, 


implementando uma seqüéncia com um arranjo 


Se uma sequência 5 for implementada usando-se uma lista duplamente encadeada, será obtida 
performance semelhante a da classe java util linkedList Suponha, então, que se pretende imple- 
mentar uma seqiéncia 5, armazenando cada elemento e de 5 em uma célula Ali] de um arranjo 
A. Pode-se definir um objeto posição p para abrigar um indice i e uma referência para o arranjo 
A, como variáveis de instância neste caso, O maior problema com esta abordagem, entretanto, € 
que as células de A não lém como referenciar suas posições correspondentes. Portanto, após uma 
operação addFirst, não existe maneira de informar as posições existentes em 5 de que suas colu- 
cações foram acrescidas de | (lembre-se que as posições de uma segúéncia são sempre definidas 
em relação a seus vizinhos, não em relação а sua colocação» Assim. ao se implementar uma 
sequência genérica usando um arranjo, precisa-se adotar uma estratégia diferente. 

Considere-se uma solução alternativa na qual, em vez de armazenar os elementos de 5 no arranjo 
A, armazena-se um novo tipo de objeto posição em cada uma das células de A, e guardam-se os ele- 
mentos nessas posições. O novo objeto posição p abriga o indice i e o elemento e associado com p. 

Com essa estrutura de dados, apresentada na Figura 6.5, percorre-se facilmente o arranjo 
para atualizar a variável г de cada posição, cuja colocação foi alterada em Função de inserções 
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Figura 6.8 Implementação do TAD seqüencia baseada em um arcano, 
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Questões de eficiência com uma sequência baseada em arranjo 


Nesta implementação de sequência, os métodos addFirst, addBefore, addAfter e remove con- 
somem um tempo On) porque é preciso deslocar a posição dos objetos para abrir espaço para 
as novas posições ou para preencher os vazios criados pela remoção de uma posição antiga (da 
mesma forma que os métodos insert ou remove baseados em índices). Todos os outros métodos 
baseados em posições consomem tempo CX I). 


6.5 Estudo de caso: a heurística mover-para-frente 


Suponha que se deseja manter uma coleção de elementos, ao mesmo tempo em que se mantém 
o número de vezes que cada elemento é acessado. Manter esse tipo de contagem permite saber 
quais elementos estão entre os "dez mais” populares, por exemplo, Exemplos de tais cenários 
incluem um navegador Web que mantém os endereços Web mais populares (ou URLs) que um 
usuário visita, ou um programa de álbum de fotos que mantém uma lista das imagens mais popu- 
lares para um usuário, Além disso, uma lista de favoritos pode ser usada em uma interface gráfica 
(GUI) para manter os botões mais usados em um menu pull-down, € então apresentar menus 
pull-down condensados, contendo as opções mais populares. 

Em função disso, nesta seção será analisada à implementação do TAD lista de favoritos, que 
suporta os métodos size( ) e isEmptyí ) hem como os que seguem: 


access(ek acessa o elemento e, incrementando seu contador de acesso e acrescen- 
ta o mesmo na lista de favoritos se ainda não estiver presente. 


remove(ey remove o elemento e da lista de favoritos desde que ele já esteja ld. 


Тор}; retoma uma coleção iterável com os & elementos mais acessados. 


6.5.1 Usando uma lista ordenada e uma classe aninhada 


A primeira implementação da lista de favoritos que será considerada (nos Trechos de código 6-19 
6.20) é construir uma classe, FavoritList, que armazena as referências para os objetos acessados 
em uma lista encadeada, ordenada pelo número de acessos. Esta classe usa um recurso de Java 
que permite definir uma classe aninhada relacionada dentro da definição da classe mais externa. 
Esta classe aninhada deve ser declarada static, para indicar que sua definição está relacionada 
à classe mais externa e não a uma instância especifica desta classe, O uso de classes aninhadas 
permite definir classes de “auxilio” ou “suporte” que podem ser protegidas de uso externo. 
Neste caso, a classe aninhada Entry armazena para cada elemento e da lista um par (cv), onde 
сё o contador de acessos e v é uma referência de valor para o próprio elemento e. Cada vez que 
um elemento é acessado, localiza-se o mesmo na lista Cinserindo-o se nào for encontrado) e incre- 
mentá-se seu contador de acessos. A remoção implica na localização do elemento e sua remoção 
da lista encadeada. Retornar os k elementos mais acessados implica apenas copiar as entradas de 
valor em uma lista de resultados de acordo com sua ordem na lista encadeada interna. 


/** Lista de elementos favoritos com seus contadores de acesso. */ 
public class Favoritelist<E> | 

protected PositionList<Enty <E> > fList; # Lista de entradas 

Fe Construtor; tempo Hij */ 

public Favaritel isti ) | fList = new NodePositionList Елігу Е = —4 Y } 

+ Retorna a quantidade de elementos na lista; tempo O(1) */ 

public int size( ) return fList.size( |; ] 

/** Indica quando a lista está vazia; tempo 041) */ 
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public boolean isEmpty() { return fListisempty();) 
/** Remove o elemento indicado desde que ele esteja na lista; tempo Gin) */ 
public void removefE obj) { 


Position « Entry E--- p = findíobj); // procura por obj 
if (p != null) 

fList.removeip}; H remove a entrada 
} 


/** Incrementa o contador de acesso de um dado elemento e insere o mesmo se ainda não 
+ pstivor presente; tempo Cin) */ 


public void access(E obj) | 

Position Entry ZE=>=> p = find(objy encontra a posição de obj 

if (p != null) 
p.element( J.incrementCount( ); // incrementa contador de acesso 

else | 
fList.addLastinew Entry -E-— (obj ff acrescenta uma nova entrada no fim 
p = fList.last(); 

movellpip); ії move a entrada para sua posição final 

} 


/** Encontra a posição de um dado elemento ou retorna null; tempo On) */ 
protected Position Entry E > > find(E obj) ( 
for (Position Entry <E>> p: fList.positians( |) 
if (value(p).equals(obj)) 
return p; ff encontrado na posição p 
return null; пао encontrado 
} 
/** Move a entrada para cima para sua posição correta na lista; tempo On) */ 
protected void moveUp(Posilion- Entry E — cur) | 
Entry-—-E- е = curelement ); 
int c = count(cur); 
while (cur != fList.first()) [ 
Position « Entry E---- prev = fList,previcur); ff posição anterior 


if ic <= count(prev)) break; ff a entrada está na posição correta 
fList set(cur, prev elementi )): move para baixo a entrada anterior 
cur = prev; 


} 
fList.seticur e); armazena a entrada em sua posição final 
| 


Trecho de código 6,19 Classe FavoriteList. (Continua no Trecho de código 6.20) 


/** Retorna os k elementos mais acessados, dado k; tempo Dik) */ 
public Iterable — E= toplint К) [ 
if (k < ОДК > size() 
throw new lllegal&rgumentException(* Invalid argument") 
PositionList<E> T = new NodePositionList ED): ¿lista dos top-k 
imi=0 contador de entradas inseridas na lista 
for (Entry E= e: fist) f 


if {++ >= К} 
break; ¿“odas as k entradas foram inseridas 
T.addLast(e.value()) “acrescenta uma entrada na lista 


| 
return T, 
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/** Representação string da lista de favoritos */ 
public String toString() { return fList.toString( ); } 
/** Método auxiliary que obtém o valor de uma entrada em uma dada posição */ 
protected E valuelPosition<Enty<E> > p) [ return ( p.element( )).value( ); } 
/** Metodo auxiliary que obtém o contador de uma entrada em uma dada posição. */ 
protected int count(Position <Entry<E>> p) [return ( p.elementí )}.counti y; } 
/** Classe aninhada que armazena os elementos e seus contadores de acesso. */ 
protected static class Entry --E- | 

private E value; //elementa 

private int count, // contador de acessos 

/** Construtor */ 

Entry(E v) { count = 1; value = v; } 

/** Retorna o elemento */ 

public E value) | return value; | 

/** Retorna o contador de acessos */ 

public int counti ) | return count; ) 

/** Incrementa o contador de acessos */ 

public Int incrementCounti) { return «count; | 

/** Representação string da entrada na forma [contador valor) */ 

public String toString() { return " [" + count +", " + value + "] ";] 


} 
|  Fim da classe FavoriteList 


Trecho de código 6.20 Classe FavoriteList, incluindo a classe aninhada Entry, para representar 
os elementos e seus contadores de acesso, (Continuação do Trecho de código 6.19.) 


6.5.2 Usando uma lista com a heurística mover-para-frente 


A implementação anterior da lista de favoritos executava o método access(e) em um tempo 
proporcional ao índice de e na lista de favoritos, Isto é, se e € o k-ésimo elemento mais popular 
da lista, então acessar o mesmo consome tempo Oik}. Em sequências de acesso da vida real, in- 
cluindo aqueles gerados pelas visitas que os usuários fazem a uma página da Web, é comum que, 
uma vez que um elemento foi acessado, o mesmo seja acessado novamente em breve. Diz-se que 
tais cenários têm referência de localização. 

Uma heurística ou regra que tira vantagem da referência de localização que está presente 
em uma sequência de acessos é a heurística mover-para-frente. Para aplicar esta heurística, 
cada vez que um elemento é acessado, move-se o mesmo para frente da lista. O que se espera, 
naturalmente, é que este elemento seja acessado novamente em breve, Considere, por exemplo, o 
cenário no qual existem n elementos e a seguinte série de m acessos: 


* elemento 1 é acessado n vezes 
«+ elemento 2 é acessado n vezes 
Egas 

* clemento n é acessado п vezes 


Se os elementos forem armazenados ordenados pelos seus contadores de acesso, inserindo 
cada elemento a primeira vez que ele é acessado, então 


* Cada acesso ao elemento | executa em tempo Ol) 
+ Cada acesso ao elemento 2 executa em tempo (42) 
È 
Š 


Cada acesso ao elemento n executa em tempo Qin) 
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Logo, o tempo total para executar a série de acessos é proporcional a 


nin- 1) 


a+ 24 + 3n cnn nl +++ nEn- 
а 1 
que é Cr |. 
Por outro lado, se for usada à heurística mover-para-frente, inserindo cada elemento a pri- 
meira vez que é acessado, então 


+ Cada acesso ao elemento | executa em tempo CX 1) 
* Cada acesso ao elemento 2 executa em tempo (X 1) 


е Cada acesso ao elemento n executa em tempo CH i) 


Assim. © tempo para executar todos os acessos neste caso é O(n ). A implementação mover- 
para-frente, portanto, tem um tempo de acesso mais rápido para este cenário, Este beneficio tem 
um custo, entretanto. 


Implementando a heurística mover-para-frente em Java 


No Trecho de código 6.21, apresenta-se a implementação de uma lista de favoritos usando a 
heurística mover-para-frente. Implementa-se a abordagem mover-para-frente, neste caso, defi- 
nindo-se uma classe nova, FavorteListMTF. que estende a classe FavoriteList e sobrecarrega as 
definições dos métodos movelp e top. Neste caso, o método movellp simplesmente remove o 
elemento acessado da sua posição atual na lista encadeada, e então insere este elemento de volta 
no inicio da lista. O método top, por outro lado, ё mais complicado. 


Problemas com a heurística mover-para-frente 


Agora que a lista de favoritos não está mais sendo mantida ordenada pelo valor dos conta- 
dores de acesso, quando se buscam os & elementos mais acessados, € necessário procurar pelos 
mesmos. Neste caso, pode-se implementar o método topiki como segue: 


1. Copiam-se as entradas da lista de favoritos em outra lista, C, € cria-se uma lista vazia, Т, 
Percorrem-se a lista C k vezes. Em cada varredura. procura-se pela entrada de C com o 
maior contador de acesso, remove-se esta entrada de C e insere-se a mesma no fim de T. 
3, Retorna-se a lista T. 


гыр 


Esta implementação do método top consome tempo UM Es). Logo, quando & é uma constante, 
o método top executa em tempo Cr). Isso ocorre, por exemplo, quando se deseja oer a lista 
do “dez maiores". Entretanto, se É € proporcional a n, então top executa em tempo On’). Isso 
ocorre. por exemplo, quando se deseja a lista dos “25% maiores 

Como а abordagem mover-para-frente é apenas uma heurística ou regra, existem sequências 
de acesso nas quais o uso desta abordagem é mais lento do que a manutenção simples da lista de 
favoritos ordenada pelos contadores de acesso. Além disso, ela reduz a velocidade potencial dos 
acessos que possuem referência de localização, implicando em uma demora maior na geração do 
relatório dos melhores elementos, 


6.5.3  Possiveis usos de uma lista de favoritos 


No Trecho de código 6.22, é apresentado um exemplo de aplicação da lista de favoritos para 
resolver o problema de manter as URLs mais populares a partir de uma sequência simulada de 
acessos à páginas da Web, Este programa acessa um conjunto de URLs em ordem decrescente, e 
então exibe uma janela que mostra a página da Web mais popular acessada na simulação, 
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public class FavoriteListMTF<E> extends FavoriteList  E-- | 
/** Construtor default */ 
public FavoriteListMTF( ) { } 
/** Move uma entrada para a primeira posição: temp 041) */ 
protected void movellp(Position<Entry<E>> pos) | 
TList.addFirst(fList.rermove[pos]); 
] 
/** Retorna os k elementos mais acessados, para um dado k; tempo; O(kn) */ 
public Iterabla-E-- top(nt k} I 
if (k = Oll k => size }) 
throw new lllegalArgumertException(" Invalid argument"). 
PositionLisi<E= T = new NodePositionList<E>[); — /tap-k list 
if (isEmpty( 9l { 
if copia as entrada para uma lista temporária C 
PositionLIst — Entry- E> > C = new NodePositionList= Entry =E= y; 
for (Entry--E- > e: fList) 
C.addL ast(e): 
encontra os k primeiros elementos, um de cada vez 
for (inti = 0; i = k; i++) 1 
Position Entry c E> > maxPos = null; // posição do elemento superior 
int maxCount = —1; // contador de acessos do elemento superior 
for (Position--Entry <E>> p; C.positions( у) | 
і! examina todas as entradas de C 
int c = countip}; 


if (c > maxCount) | A encontrada a entrada com maior contador de acessos 
maxCount = c; 
maxPos = р; 
| 
} 
T.addLast(value(maxPos); JV insere a maior entrada na lista T 
C.remove(maxFPos]; i remove a maior entrada da lista C 
| 
| 
return T; 


) 
} 


Trecho de código 6.21 Implementação da classe FavoriteListMTF usando a heurística nover- 
para-frente. Esta classe estende FavonteList (Trecho de código 6.196,20) € sobrecarrega os mé- 
todos moveUp e top. 


import java.io.*; 
import javax swing *; 
import java.awt.*:; 
import java.net.*; 
import java. util Random; 
/** Programa exemplo para as classes FavoriteList e FavoriteListMTF +, 
public class FavoriteTester [ 
public static void main(String| | args) ( 
String[ ] urlAray = ("http: //wiley.com", "http: //datastructures.net", 
"hrtp: //algorithmdesign.net*, "httpz//www.brown.edu", 
"hip ше edu” t 
Favoritel ist String> Li = new FavoriteList String y; 
FavoriteListMTF -String-- L2 = new FavoriteListMTF « String--( ); 
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| 
) 


intn = 20; quantidade de operações de acesso 

H Canário simulado: acessar n vezes uma URL aleatória 
Random rand = new Random ); 

for (int К = 0; k « n; k++) { 


System.out.println(" - - - - ron aum 
int i = rand.nextint(urlArray length); J indice randómico 
String url = urlArray[i]; // URL randômica 
System.out.println(" Accessing: * + url}; 
L1.accessiurl); 
System.out.println("L1 = "+L1} 
L2.accessiurl); 
System.out,printini"L2 = " + 12); 
) 
int t = L1.5ize( V2; 
System. out.printin(" = = - - —€——(——L A— Ho 
System.out.printin("Top * +t+" in L1 = " + L1 topt: 


System.out.printin("Top *+t+" in L2 = " + L2.top(t] 
ff Exibe uma janela de navegador mostrando a URL mais popular de L1 
try [ 
String popular = L1.top(1) iterator( ).next( |; “URL mais popular de L1 
JEditorPane jep = new JEditorPaneipopular); 
jep.setEditable(false) 
‚Frame frame = new JFramelpopular); 
frame.getContentPane(.add(new JScrollPane(jep), Border Layout. CENTER); 
frame. .setSizei640, 480); 
frame setVisibleítrue); 
| catch (lOException e) | і? ignara as exceções de E/S 
| 


Trecho de código 6.22 Demonsiração do uso das classes FavoriteList e FavoriteListMTF para 
contar os acessos a páginas da Web, Esta simulação acessa randomicamente várias páginas URL, 
e então exibe a página mais popular. 


6.6 


Exercícios 


Para obter auxilio e o código fonte dos exercícios, visite java.datastructures.net. 


Reforço 


R-61 Desenhe a representação de uma lista arranjo inicialmente vazia A depois de 
executar a seguinte sequência de operações: add(0,4), add(0,3), add(,2). 
add(2,1), adch 1.5). add( 1.6), add(3,7), add(0,8). 

R-6.2 Apresente uma justificativa para os tempos de execução, apresentados na 
Tabela 6.2, para os métodos da lista arranjo implementada usando um ar- 
ranjo (näo-extensivel). 

R-6.3 Forneça uma classe adaptadora que suporte a interface Stack usando os 
métodos do TAD lista arranjo. 

R-6,4 Reescreva a justificativa da Proposição 6.2, partindo do princípio de que 
o custo de aumentar o arranjo de um tamanho k para 24 € ЗЕ ciberdólares. 


R-6.5 


R-6.6 


R-6.7 


R-6.5 


R-6.9 


R-6.10 


R-6.11 


R-6.12 


R-6.13 


R-6.14 


R-6.15 


R-6.16 


R-6.17 
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Quanto se deve cobrar por cada operação de inserção para fazer o esquema 
de amortização funcionar? 

Forneça descrições em pseudocódigo de algoritmos para os métodos 
addBefore(p,e), addFirst(e) e addLastie) para o TAD lista de nodos, supon- 
do que a lista é implementada usando uma lista duplamente encadeada. 
Desenhe figuras demonstrando cada um dos passos principais dos algorit- 
mos desenvolvidos no exercício anterior, 

Forneça os detalhes de uma implementação baseada em arranjo de um TAD 
lista de nodos, incluindo como executar os métodos addBefore e addAfter. 


Fomeça trechos de código em Java para os métodos da interface Position- 
List, do Trecho de código 6.5, que não estejam incluídos nos Trechos de 
código 6.9-6,11. 

Descreva método não-recursivo para inverter uma lista de nodos represen- 
tada usando-se uma lista duplamente encadeada e que faça uma única pas- 
sada pela lista (você pode usar os ponteiros internos). 

Dado o conjunto de elementos [abc d.e armazenado em uma lista, mos- 
tre o estado final da lista assumindo que se usa a heurística mover-para- 
frente e acessam-se os elementos conforme a seguinte sequência (a, b,c,d, e, 
ka.cfb.de). 

Suponha que estejam sendo mantidos contadores de acesso em uma lista L 
de т elementos. Suponha também que foram feitos um total de kn acessos 
aos elementos de L, para algum inteiro k = 1. Qual o número mínimo e 
máximo de elementos que foram acessados menos de É vezes? 

Escreva o pseudocódigo que descreve como implementar todas as opera- 
ções do TAD lista arranjo usando um arranjo de maneira circular, Qual o 
tempo de execução para cada um desses métodos? 

Usando os métodos da interface Sequence, descreva um método recursivo 
para determinar se uma seqüéncia Y de a objetos inteiros contém um dado 
inteiro k. O método não pode conter laços. Quanto espaço adicional o mé- 
todo irá precisar além do espaço usado por 5? 


Descreva brevemente um novo método de sequência, makeFirst(p), que 
move o elemento na posição p de uma seqüéncia S para a primeira posição 
de $, mantendo a ordem relativa dos demais elementos inalterada. Isto é, 
makefFirst(p) executa um mover-para-frente. O método deve executar em 
tempo N 1} considerando que 5 seja implementado usando uma lista dupla- 
mente encadeada. 


Descreva como usar uma lista arranjo e um campo int para implementar 
um iterador. Inclua trechos de pseudocódigo que descrevam os métodos 
hasHextí ) e пехі |. 


Descreva como criar um iterador para uma lista de nodos que retorne todos 
os elementos da lista. 


Suponha que se mantenha uma coleção C de elementos, tais que, cada vez 
que se acrescenta um novo elemento na coleção, copia-se o conteúdo de C 
em uma nova lista arranjo com exatamente o mesmo tamanho. Qual o tem- 
po de execução para se adicionarem n elementos a coleção C inicialmente 
varia neste caso? 
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R-6.15 


R-6.19 


R-6.241 


Criatividade 


C-6.1 


C-6.3 


C-64 


C-5.5 


C-6.6 


C-6.7 


Descreva a implementação dos métodos addLast e addBefore usando ape- 
nas os métodos do conjunto isEmpty., checkPosition, first, last, prev, next, 
addAfter, addFirst |. 

Seja L uma lista de n itens ordenados em ordem decrescente de contagem 
de avesso, Descreva uma sério de acessos Mn} que irão inverter L. 

Seja L uma lista de n neos mantidos de acordo com a heurística mover- 
para-frente. Descreva uma série de acessos On] que irão inverter L. 


Forneça o pseudocódigo para os métodos de uma nova classe, Shrinking- 
ArrayList, que estenda a classe ArrayIndexList apresentada no Trecho de 
código 6.3, adicionando o método shrinkToFit( |, que substitui o arranjo 
hase corrente por um cuja capacidade seja exatamente igual ao número de 
elementos atuais da lista arranjo. 

Descreva as alterações necessárias na implementação de um arranjo eaten- 
sivel apresentado no Trecho de código 6.3, de maneira a comprimir pela 
metade o tamanho А do arranjo sempre que o número de elementos do 
vetor cair abaixo de N/d, 

Mostre que usando o arranjo extensível que cresce e encolhe, como foi des- 
crito nos exercicios anteriores, a seguinte sequência de In operações conso- 
me tempo Cw): Gu operações push sore uma lista arranjo com capacidade 
inicial N = I; (i/) rt operações pop (remoção do último elemento). 

Mostre como melhorar a implementação do método add do Trecho de códi- 
go 6.3, de maneira que, em caso de overflow, os elementos sejam copiados 
para seu lugar definitivo no novo arranjo, isto é, nenhum deslocamento é 
Feito neste caso. 

Considere a implementação de um TAD lista arranjo que usa um arranjo 
extensível mas que, em vez de copiar os elementos para um novo arranjo 
com o dobro do tamanho (sto é, de N para 2N) quando sua capacidade é al- 
cangada, copia os elementos para um arranjo com [ N/4 | células adicionais, 
aumentando sua capacidade de N para N + | 4/4]. Mostre que a execução 
de uma sequência de 4 operações push (isto ё, inserções no final? ainda 
becula em Le паро un m) nes Caso. 

A implementação de ModePositionList apresentada nos Trechos de código 
6,9-6.11 não faz verificações de erro para testar se uma dada posição p é 
realmente membro dessa lista em particular, Por exemplo, se p É uma po- 
sição da lista 5, е chamamos T.addAfter(p, e) em uma lista 7 diferente, na 
realidade adicionamos o elemento em 5 logo após p. Descreva como alterar 
a implementação de NodePositionList de uma forma eficiente que impeça 
esses MAUS USOS, 

Suponha que se deseja estender o tipo abstrato de dados sequência com 
os métodos indexOfElement(e) e positionOfElementi e). que retornam, res- 
pectivamente, o índice e a posição do elemento e (primeira ocorrência) na 
sequência. Mostre como implementar esses métodos os descrevendo em 
termos de outros métodos da interface Sequence. 


C-6.8 


C-65.9 


C-6.10 


C-6.11 


C-6.12 


C-6.13 


C-6.14 


с-ф. 15 


C-6.16 


C-6,17 


C-6.18 
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Forneca uma adaptação do TAD lista arranjo para o TAD deque que seja 
diferente da fornecida na Tabela 6.1. 

Descreva a estrutura e o pseudocódigo para uma implementação baseada 
em arranjo de um TAD lista arranjo que obtém tempo Oil) para inserções 
e remoções no índice 0, bem como inserções e remoções no fim da lista 
arranjo. À implementação deve prever, também, um tempo constante para o 
método get, (Dica: pense em como estender a implementação baseada em 
arranjo circular do TAD fila apresentado no capítulo anterior). 


Descreva uma forma eficiente de colocar uma lista arranjo representando 
um conjunto de n cartas, em uma ordem aleatória. Pode ser usada a função 
randomintegeri n), que retorna um número aleatório entre Den — |, inclusi- 
ve. O método deve garantir que todas as possíveis ordenações tenham igual 
probabilidade. Qual é o tempo de execução do método? 

Descreva um método para manter uma lista de favoritos L tal que todo ele- 
mento de £ seja acessado pelo menos uma vez nos últimos л acessos, onde 
n é o tamanho de L. Este esquema deve acrescentar apenas um tempo Cl) 
amortizado em cada operação. 

suponha que exista uma lista L de n elementos mantida pela heurística mo- 
ver-para-trente. Descreva uma sequência de nº acessos que é garantida para 
consumir tempo (Mr) para executar sobre L. 

Projete um TAD lista de nodos circular que abstrai uma lista encadeada 
circular da mesma forma que o TAD lista de nodos abstrai uma lista dupla- 
mente encadeada. 

Descreva como implementar um iterador para uma lista encadeada circular. 
Uma vez que hasNext sempre irá retornar true neste caso, descreva como 
implementar hasNewNexti ), que irá retornar true se e somente se o próxi- 
mo nodo da lista ainda não tiver sido retornado pelo iterador, 

Descreva um esquema para criar iteradores de lista que falham rapidamente, 
isto é, tornam-se inválidos tão logo a lista subjacente seja alterada. 

Um arranjo é esparso se a maioria de suas entradas são null. Uma lista 
L pode ser usada para implementar tal arranjo, A, de forma eficiente. Em 
especial, рага cada célula não-nula Alf) pode-se armazenar uma entrada 
(i.e) em L onde e € o elemento armazenado em Ali]. Esta abordagem nos 
permite representar À consumindo espaço (Mar), onde m é a quantidade de 
entradas não-nulas de A. Descreva e analise formas eficientes de executar 
os métodos do TAD lista arranjo em tal representação. É melhor armazenar 
as entradas de L em ordem crescente de índices ou não? 


Existe um algoritmo simples mas ineficiente, chamado ordenação de bolha, 
para ordenar uma sequência $ de m elementos comparáveis, Este algoritmo 
percorre a sequência m — | vezes e, em cada varredura, compara o elemento 
corrente com o próximo, e troca os dois se eles estiverem fora de ordem. 
Apresente uma descrição em pseudocódigo para a ordenação da bolha que 
seja tão eficiente quanto possível assumindo que 5 é implementado usando-se 
uma lista duplamente encadeada. Qual o tempo de execução deste algoritmo. 
Responda o Exercício 6.17 assumindo que 5 é implementado usando uma 
lista arranjo. 
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C-6.19 


C-6.20 


C-6,22 


C-6.23 


C-6.24 


Projetos 
P-H.| 


P-6.2 


P-6.3 


* N. de T. Em inglés, samira! join. 


Uma operação útil sobre bancos de dados é a junção natural", Se enten- 
dermos um banco de dados como uma lista de pares ordenados de objetos, 
então a junção natural dos bancos de dados A e B é a lista de todas as triplas 
ordenadas (x, v, г), tal que o par (x,v) se encontra em A е o par (v, г}, em B. 
Descreva e analise um algoritmo eficiente para computar a junção natural 
de uma lista À de 4 pares e uma lista B de m pares. 

Quando Bob deseja enviar uma mensagem M para Alice vià Internet, ele 
quebra M em pacotes de dados, numera os pacotes consecutivamente е in- 
jeta-os na rede. Quando os pacotes chegam no computador de Alice, eles 
podem estar fora de ordem, de maneira que Alice precisa remontar a se- 
quência em ordem antes de se certificar de ter recebido toda mensagem. 
Descreva um esquema eficiente para Alice fazer isso, Qual o tempo de exe- 
cução deste algoritmo? 

Forneça uma lista L com n inteiros positivos, cada um representado usando 
k = [log nl+ 1 bits, descreva um método de tempo Cr) para encontrar um 
inteiro de k bits que nào esteja em £L. 

Argumente porque qualquer solução para o problema anterior deve execu- 
tar em tempo fm). 

Apresente uma lista L com n inteiros arbitrários, projete um método de 
tempo От) para encontrar um inteiro que não possa ser formado pela soma 
de dois inteiros que estão em L. 


Isabel tem uma forma interessante de totalizar a soma dos valores de um 
aranjo A de rr inteiros, onde n é uma potência de dois. Ela criou um ar- 
rango B com a metade do tamanho de A e fez Blij = Aldi] + Al + 1], 
para i = (hl, ИША 1. Se B tem tamanho 1, então ela retoma A[U]. 
Em qualquer outro caso, ela substitui A por E е repete o processo, Qual o 
tempo de execução de seu algoritmo? 


Implemente um TAD lista arranjo como um arranjo extensível usado de 

maneira circular de forma que inserções e deleções no início € no fim do 

arranjo sejam executadas em tempo constante. 

Implemente o TAD lista arranjo usando uma lista duplamente encadeada, 

Mostre experimentalmente que esta implementação é pior do que a aborda- 

gem baseada em arranjo. 

Escreva um editor de textos simples que armazena e exibe uma string de ca- 

racteres usando o TAD lista juntamente com um objeto cursor que destaca a 

posição de um dos caracteres da string. O editor deve suportar as seguintes 

operações: 

* left: move o cursor um caractere para а esquerda (ou nào faz nada se 
estiver no fim do texto). 

= rigth: move 0 cursor um caractere para a direita (ou não faz nada se esti- 
ver no fim do texto). 
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* cut: apaga o caractere à direita do cursor (ou não faz nada se estiver no 
fim do texto). 
* paste (с): insere o caractere с após o cursor. 

P-6.4 Implemente uma dista de favoritos com fases. Uma fase consiste em N 
acessos na lista para um dado parámetro N. Durante uma fase, a lista deve 
manter seus elementos ordenados em ordem decrescente dos contadores de 
acesso, Ao final da fase, ela deve limpar os contadores de acesso e iniciar a 
próxima fase. Experimentalmente, determine quais são os melhores valores 
de N para vários tamanhos de lista. 

P-6.5 Escreva uma classe adaptadora completa que implemente o TAD segiiência 
usando um objeto java.util. ArrayList. 


P-6.6 Implemente a lista de favoritos usando uma lista arranjo em vez de uma lis- 
ta. Compare-a, experimentalmente, com uma implementação que use lista. 


Observações sobre o capítulo 


A concepção de entender estruturas de dados como coleções (e outros princípios de projeto 
orientado a objetos) podem ser encontrados nos livros de projeto orientado a objetos de Booch 
[14], Budd[17], Golberg e Robson [40] e Liskov e Guttag[69]. Listas e iteradores são concertos 
impregnados no framework de coleções de Java. Nosso TAD lista é derivado da abstração “posi- 
gio”, introduzida por Aho, Hoperofte Ullman [5] e o TAD lista de Wood [100]. Implementações 
de listas usando arranjos e listas encadeadas são discutidas por Knuth [62]. 
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7.1 Árvores genéricas 


Peritos em produtividade dizem que as mudanças se originam em pensamentos “não-lincares”. 
Neste capítulo, uma das estruturas de dados näo-lineares mais importantes da computação será 
estudada: as drvores, Estruturas do tipo árvore são, na verdade, uma ruptura em organização de da- 
dos, pois permitem a implementação de uma gama de algoritmos muito mais rápidos do que no uso 
de estruturas de dados lineares, tais como listas. Árvores também provêm uma forma natural de or- 
ganizar os dados e, consequentemente, se tornaram estruturas ubiquas em sistemas de arquivos, in- 
terfaces gráficas com o usuário, bancos de dados, sites da Web e outros sistemas computacionais. 

Não é muito claro o que os peritos querem afirmar com pensamento “não-linear”, mas quando 
se diz que árvores são não-lineares, a referência é feita a um relacionamento organizacional que é 
mais rico do que simplesmente "antes" e “depois” entre objetos de uma sequência. Os relaciona- 
mentos em uma árvore são hierárquicos, com alguns objetos estando “acima” e outros “abaixo” 
dos outros. Na verdade, a principal terminologia das estruturas de árvore vem das árvores genea- 
lógicas, sendo os termos “pai”, “filho”, “ancestral” e “descendente” os mais usados para descrever 
os relacionamentos. A Figura 7.1 apresenta um exemplo de árvore genealógica. 


Shuah 
Isbague 
A 
Midiá І 
Hanoque 
Efer 
Med: ЕШ 
Ded 
Jocsa d 
Einrä 
Майа 
eclar 
Abdeel 
Mibsio 
Abraão umi Mismá 
Ismael Duma 
Massa 
Hacade 
Tema 
letur 
Nafis 
Quedama 
Elifaz 
Rewel 
Esaú Jens 
laižo 
Cord 
Isaque Benjamin 
Joseph 
Diná 
Zebulum 
Isacar 
Jack Israel} Aser 
Gade 
Naftali 
Judá 
Levi 
Simedo 
Ruben 


Figura 7.1 Uma árvore genealógica que apresenta os descendentes de Abraão como descrito 
no Gênesis, capítulos 25-36. 
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7.1.1 Definição de árvore e propriedades 


Uma drvore é um tipo abstrato de dados que armazena elementos de maneira hierárquica. Com 
exceção do elemento do topo, cada elemento da árvore tem um elemento paí e zero ou mais 
elementos filhos. Uma árvore é normalmente desenhada colocando-se os elementos dentro de 
elipses ou retângulos e conectando pais e filhos com linhas retas. (Ver Figura 7.2.) Normalmente, 
o elemento topo é chamado de raiz da árvore, mas é desenhado como sendo o elemento mais alto, 
com todos os demais conectados abaixo (exatamente ao contrário de uma árvore real). 


Electronics R' Us 


^ 


Figura 7.2 Uma árvore com 17 nodos representando a estrutura organizacional uma corpora- 
ção ficticia, А raiz armazena Electronics R' Us. Os filhos da raiz armazenam P&D, Vendas, Com- 
pras e Manufatura. Os nodos internos armazenam Vendas, Internacional, Ultramar, Eletronics 
R'Us e Manufarura. 


Definição formal de árvore 


Formalmente, define-se uma árvore T como um conjunto de nodos que armazenam elementos 
em relacionamentos pai-filho com as seguintes propriedades: 


e Se T nào é vazia, ela tem um nodo especial chamado de raiz de T que não tem pai. 
+ Cada nodo v de T diferente da raiz tem um único nodo paí, w; todo nodo com pat w é filho 
de w. 


Observa-se que, por esta definição, uma árvore pode ser vazia, o que significa que ela não 
tem nodos. Esta convenção permite que se defina uma árvore recursivamente, de maneira que 
uma árvore Гоц está vazia ou consiste em um nodo r, chamado de raiz de T, e um conjunto (pos- 
sivelmente vazio) de árvores cujas raízes são filhas de r. 


Outros relacionamentos entre nodos 


Dois nodos que são filhos do mesmo pai são irmãos. Um nodo v é externo se v não tem filhos. 


Um nodo v é interno se tem um ou mais filhos. Nodos externos também são conhecidos como 
Jolhas. 


Exemplo 7.1 Na maioria dos sistemas operacionais, os arquivos são organizados hierarguica- 
mente em diretórios aninhados (também chamados de postas) que são apresentados do usuário 
sab a forma de uma árvore (ver a Figura 7.3) Mais especificamente, os nodos internos de uma 
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drvore xao associados a diretórios, e os nodos externos sdo associados a арх normais. Nas 
sistemas operacionais UNIX e Linux, a raiz da drvore é apropriadamente chamada de “diretório 
raiz", e é representada pelo simbolo "Z". 


ED 


notas П i i notas 


{тп | |tm3 prz | | рга 
Ш Е Е а E dias E 
compro venda mercado 
baixo alto 


Figura 7.3 Arvore representando parte de um sistema de arquivos. 


Um nodo ir é ancestral de um nodo v, se 4 = v, ou i é ancestral do ра de v. Da mesma 
forma, diz-se que um nodo v é descendente de um nodo n se u é ancestral de v. Por exemplo, 
na figura 7.3, c5252/ é ancestral de papers/, e pr3 é descendente de cs016. A sabárvore de T 
enraizada no nodo v é a árvore que consiste em todos os descendentes de v em T (incluindo o 
próprio v). Na Figura 7.3, a subárvore enraizada em cs016/ consiste nos nodos с5016/, grades, 
homeworks/, programas, hw1, he, hw3. pri, pre e pra, 


Arestas e caminhos em árvores 


Uma aresta de uma árvore T é um par de nodos (4,4) tal que u € par de v ou vice-versa. Um cd- 
minho de T é uma seqüéncia de nodos tais que quaisquer dois nodos consecutivos da segiiência 
formam uma aresta, Por exemplo. a árvore da Figura 7.3 contem o caminho (cs252/, projects), 
demos/, market). 


Exemplo 7.2 O relacionamento de herança entre classes em programas dava forma uma drvo- 
re. A raiz, java.lang.Object, do ancestral de todas as outras classes. Cada classe C é descendente 
desta raiz e é а raiz de uma subirvore de classes que estendem C. Logo, existe um cominho de C 
para a raiz, java.lang.Object, nede drvore de herança. 


Árvores ordenadas 


Uma árvore é ordenada se existe uma ordem linear definida para os filhos de cada nodo, ou seja. 
se d possivel identificar os filhos de um nodo como sendo o primeiro, segundo, terceiro e assim 
por diante. Tal ordenação normalmente é desenhada organizando-se 05 irmãos da esquerda para 
direita, de acordo com a relação entre os mesmos. Arvores ordenadas normalmente indicam o 
relacionamento de ordem linear existente entre os irmãos, listando-os na ordem correta, 


Exemplo 7.3 Os componentes de um documento estruturado, tal como um livro, é organizado 
hierarquicamente como uma drvore cujos nodos internos são partes, capitulos € seções, € os 
nados externos sde os parderafos, tabelas, figuras e assim por diante (ver Figura 7,4). A raiz da 
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drvore corresponde ao livro propriamente dito. Pode-se pensar ainda em expandir a drvore de 
maneira a mosirar parágrafos como conjuntos de frases, frases como conjuntos de palavras е 
palavras como conjuntos de letras, Esta drvore € um exemplo de uma drvore ordenada porque 
existe uma ordem hem-definida entre os filhos de cada nodo. 


EE 


Figura 7.4 Arvore ordenada associada a um livro. 


71.2 Otipo abstrato de dados árvore 


O TAD árvore armazena elementos em posições como as de uma lista, que são definidas em rela- 
ção às posições de seus vizinhos. As posições de uma árvore são seus modos, e o posicionamento 
pela vizinhança satisfaz as relações pai-filho, que definem uma árvore válida. Entretanto, os ter- 
mos “posição” e "nodo" são usados com o mesmo sentido no caso de árvores. Como as posições 
de uma lista, um objeto posição para uma árvore suporta o método: 


element): Retorna o objeto nesta posição. 


O poder real de um nodo posição em uma árvore, entretanto, vem dos métodos de acesso do 
TAD árvore que retomam e aceitam posições, como os que seguem: 
root/): Retorna a raiz da árvore; um erro ocorre se a árvore está vazia. 
parentivi Retorna o nodo pai de v; ocorre um erro se v for a raiz. 
children(v): Retorna uma coleção iterável contendo os filhos do nodo v. 

Se uma árvore T é ordenada, então a coleção iterável children(v) permite o acesso aos filhos 
de v na ordem, Se v é um nodo externo, então children(v) está vazio, Além do método de acesso 
fundamental acima, também se incluem os seguintes métodos de consulta: 

isinternal(v): Testa se um nodo v é interno. 
isExternal(vi: Testa se um nodo v é externo, 
isRoot(v): Testa se um nodo v é a raiz. 

Esses métodos tomam a programação com árvores mais fácil e mais legível, uma vez que pode- 
se usá-los nas condições de comandos if e de laços while, em vez de condições pouco intuitivas. 

Existe também um conjunto de métodos genéricos que uma árvore deveria suportar que não 
estão necessariamente relacionados com sua estrutura, incluindo os seguintes: 

size): Retorna o número de nodos na árvore. 
isEmpty(): Testa se a árvore tem ou não tem algum nodo. 


iterator(): Retorna um iterador de todos os elementos armazenados nos nodos da 
árvore, 
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Trecho de código 7.1 
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positions(): Retorna uma coleção iterável com todos os nodos da árvore. 
replace(ve): Retorna o elemento armazenado em v e o substitui por e. 


Qualquer método que recebe uma posição por parâmetro deve gerar uma condição de erro se 
a posição for inválida, Não se definiu nenhum método especializado de atualização para árvores. 
Em vez disso, prefere-se descrever diferentes métodos de atualização juntamente com aplicações 
específicas para árvores nos capítulos que seguem. De fato, é possível imaginar diversos tipos de 
operações de atualização, além das fomecidas neste livro. 


Implementando uma árvore 


A interface Java apresentada no Trecho de código 7.1 representa o TAD árvore. Condições de 
erro são tratadas como segue: cada método que pode receber uma posição como argumento pode 
lançar uma InvalidPositionException para indicar que a posição é inválida. O método parent lança 
uma BoundaryViolationException se for chamado sobre uma árvore varia. 

er 


* Interface para uma árvore onde os nodos podem ter uma quantidade arbitraria de filhos. 


“у 


public interface Tree E > { 


/** Retorna a quantidade de nodos da árvore, *f 
public int size( |: 

/** Retorna se a árvore está vazia, % 

public boolean isEmpty |: 


/** Retorna um iterador sobra os elementos armazenados na árvore. */ 


public Iterator--E-- iteratori |; 
/** Retorna uma coleção iterável dos nodos. */ 
public lterabla= Position-cE >> positions |: 
/** Substitui o elemento armazenado em um dado nodo. */ 
public E replacalPosition<E=> v, E el 
throws InvalidPositionException; 
/** Retorna a raiz da árvore. */ 
public Position--E- rootí | throws EmptyTresException; 
/** Retorna o pai de um dado nodo. */ 
public Positlion<E=> parentiPosition= E > v) 
throws InvalidPositionException, BaundaryViolationException; 
¿2* Retorna uma coleção бегаме! dos filhos de um dado nodo. */ 
public Iterable-- Position Е > children(Position = E= vi 
throws InvalidPositionException; 
/** Retorna se um dado nado é interna. */ 
public boolean islInternal(Position - Е v) 
throws InvalidPositionException; 
/** Retorna se um dado nodo é externo. */ 
public boolean isExternal(Position*cE- v) 
throws InvalidPositionException; 
/** Retorna se um dado nodo é a raiz da árvore. */ 
public boolean isRHoat(Fasition--E- wv) 
throws InvalidPositionException: 
| 


Interface Java Tree representando o TAD árvore. Métodos adicionais de 
atualização podem ser acrescentados dependendo da aplicação. Entretanto, não se incluem tais 
métodos na interface. 
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Uma estrutura encadeada para árvores genéricas 


Uma forma natural de se implementar uma árvore T é usar uma estrutura encadeada em que 
se representa cada nodo v de T usando um objeto posição (ver Figura 7.5a) com os campos que 
seguem: uma referência para o elemento armazenado em v, uma conexão com o pai de v e algum 
tipo de coleção (por exemplo, uma lista ou arranjo) para armazenar as conexões com os filhos de 
v. Se v é a raiz de T, então o campo parent de v é nulo, Também se armazena uma referência para 
araiz de T e o número de nodos de T em variáveis internas. Esta estrutura é apresentada de forma 
esquemática na Figura 7.5b. 


pai 


contéinar dos filhos 


(a) (b) 


Figura 7.5 Estrutura encadeada de uma árvore genérica: (a) o objeto posição associado com 
um nodo; (b) a porção da estrutura de dados associada com o nodo e seus filhos. 


A Tabela 7.1 resume a performance de implementação de uma árvore genérica usando uma 
estrutura encadeada. À análise é deixada como exercício (C-7.25), mas se observa que, usando 
uma coleção para armazenar cada um dos nodos de v, pode-se implementar childreni v) simples- 
mente retornando uma referência para esta coleção. 


DT Operação | Tempe | 


iterator, positions 


children(v) | Oc) 
isinternal, isExternal, isRoot | O(1) | 


Tabela 7.1 Tempos de execução dos métodos de uma árvore genérica com n-nódos, implemen- 
tada usando-se uma estrutura encadeada, Usa-se C, para denotar o número de filhos do nodo v. 
O espaço ocupado é (Mn). 


7.2 Algoritmos de caminhamento em árvores 


Nesta seção, serão apresentados algoritmos para executar computações de caminhamento sobre 
uma árvore, acessando-a através dos métodos do TAD árvore, 
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Altura e profundidade 


Seja v um nodo de uma árvore T. A profundidade de v é o número de ancestrais de v excluindo o 
próprio v. Por exemplo, na árvore da Figura 7.2, o nodo que armazena Internacional tem profun- 
didade 2, Observa-se que esta definição implica que a profundidade da raiz de Té 0. 

A profundidade de um nodo v também pode ser definida recursivamente como segue: 


+ ïe vé araiz, então a profundidade de v é 0- 
+ Em qualquer outro caso, a profundidade de v é um mais a profundidade do pai de v. 


Baseado nesta definição, no Trecho de código 7.2, é apresentado um algoritmo recursivo 
simples, depth, para calcular a profundidade de um nodo v de T. Este método chama a si próprio 
recursivamente sobre o pai de v e acrescenta | ao valor retornado. Uma implementação Java sim- 
ples deste algoritmo é apresentada no Trecho de código 7.3. 


Algoritmo дері Tv): 
se vé a raiz de T então 
retorne O 
sendo 
retorne | + depth(T.w), onde w são os pais de v em T 


Trecho de código 7.2 Algoritmo para computar a profundidade de um nodo v em uma árvore T. 


public static <E> int depth(Tree—E-- T, Position-- E- wH 
if (T.isRoat(v)) 
return Q; 
else 
return 1 + depth T, T. parentiv]l: 


Trecho de código 7.3 Método depth escrito em Java. 


O tempo de execução do algoritmo depth(T.v) é Od), onde d, denota a profundidade do 
nodo v па árvore Г, porque o algoritmo executa um passo recursivo de tempo constante para 
cada ancestral de v. Logo, o algoritmo depth(T.v) executa em On), no plor caso, onde a é o 
número total de nodos de 7, uma vez que um nodo de T pode ter profundidade n — 1, no pior 
caso, Apesar deste tempo de execução ser uma função do tamanho da entrada, é mais exato 
caracterizar o tempo de execução em termos do parámetro dl, uma vez que este parâmetro pode 
SET bem MTE que n. 


Altura 


A altura de um nodo v em árvore T também é definida recursivamente: 


* Se vé um nodo externo, então a altura de v é 0. 
* Em qualquer outro caso, a altura de v é um mais a altura máxima dos filhos de v. 


A altura de uma árvore não vazia T é à altura da raiz de T. Por exemplo, a árvore da Figura 
7.2 tem altura 4. Além disso, a altura também pode ser entendida como segue. 


Proposição 7.4 A altura de uma árvore não-vazia T é igual à profundidade máximo dos nodos 
externos de T. 

A justificativa deste fato é deixada como exercicio (K-7.6). Apresenta-se o algoritmo, height, 
mostrado no Trecho de código 7.4 e implementado em Java no Trecho de código 7.5, para cälcu- 
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lo da altura de uma árvore nào-vazia 7 baseado na proposição anterior e no algoritmo depth do 
Trecho de código 7.2. 


Algoritmo height): 
del 
para cada vértice v em T faça 
se v é um nodo externo de Tentäo 
ht Maxí(á, depth Tei 
retorna li 


Trecho de código 7.4 Algoritmo height! para computar а altura de uma árvore não-vazia T. 
Observa-se que este algoritmo chama o algoritmo depth (Trecho de código 7,2). 


public static <E> int height! (Tree<E> T) | 
int h — 0; 
for (Position --E-- v : T.positions |) ( 
if (T isExternal(v)) 
h= Math.maxíh, дерін, vj}; 
} 
return h; 


} 


Trecho de código 7.5 — Método height! escrito em Java. Observa-se o uso do método Max da 
classe java lang. Math. 


Infelizmente, o algoritmo heighti não é muito eficiente. Uma vez que height? chama o 
algoritmo depth(v) sobre cada nodo externo v de T, o tempo de execução de height é dado 
por On + У (1 + d), onde n é o número de nodos de T. d, € a profundidade do nodo ve E é o 
conjunto de nodos externos de T. No pior caso, o somatório E (1 + d.) é proporcional a m‘. (Ver 
Exercício C-7.6.) Logo, o algoritmo height executa em tempo On). 

O algoritmo height2, apresentado no Trecho de código 7.6 e implementado em Java no 
Trecho de código 7.7, computa a altura de uma árvore T de uma maneira mais eficiente, usando 
a definição recursiva de altura, 


Algoritmo heightz(T,v): 

se ve um nodo externo T então 
retorna 00 

sendo 
h «— 0 
para cada filho w de v em 7 faca 

hi «— maxit height? wy 

retorna | + h 


Trecho de código 7.6 Algoritmo height? para computar a altura da subárvore de T enraizada 
no nodo v. 


public static <E> int height? (Tree —E-- T, Position<E> v) | 
if (T.isExternal(vi) return 0; 
int h = 0; 
for (Position <E> w : T.children(vy 
п = Math.maxth, heighte(T, wy, 
return 1 + h; 


} 
Trecho de código 7.7 Método height? escrito em Java. 
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O algoritmo height? é mais eficiente que height? (do Trecho de código 7.4). O algoritmo é 
recursivo e, se for chamado inicialmente sobre T, será eventualmente chamado sobre cada um 
dos nodos de T. Logo, pode-se determinar o tempo de execução deste método somando, sobre 
todos os nodos, o tempo gasto em cada nodo (na parte não-recursiva). Processar cada nodo em 
children(v) consome tempo Me), onde c, denota o número de filhos do nodo v. Assim, o laço 
while tem c, iterações, e cada iteração do lago consome tempo O(1) mais o tempo das chamadas 
recursivas sobre os filhos de v. Logo, o algoritmo height? consome tempo O(1 + c) em cada 
nodo v, e seu tempo de execução é (ДУ (1 + cJ). Para completar a análise, será usada a proprie- 
dade que segue. 


Proposição 7.5 Seja T uma drvore com n nodos e faça c, denotar o número de filhos de um 
nodo v de T. Então o somatório dos vértices de T, Ec, = n — 1. 


Justificativa Cada nodo de T, com exceção da raiz, é filho de outro nodo, logo contribui com 
uma unidade na soma anterior. = 


Pela Proposição 7.5, o tempo de execução do algoritmo helght2, quando chamado sobre a 
raiz de T, é (n), onde n é o número de nodos de T. 


7.2.2 — Caminhamento prefixado 


O caminhamento de uma árvore T é uma forma sistemática de acessar ou "visitar" todos os no- 
dos de T. Nesta seção, apresenta-se um esquema básico de caminhamento para árvores chamado 
de caminhamento prefisado. Na seção seguinte, será estudado outro esquema de caminhamento 
denominado caminhamento pós-fixado. 

Em um caminhamento prefixado de uma árvore T, a raiz de Té visitada primeiro e, en- 
tão, as subárvores, cujas raizes são seus filhos, são percorridas recursivamente. Se a árvore 
está ordenada, então as subárvores são percorridas de acordo com a ordem dos filhos. A ação 
específica associada com a “visita” de um nodo v depende da aplicação do caminhamento, 
e pode envolver qualquer соза, desde incremento de um contador até um cálculo comple- 
хо para v. O pseudocódigo para o caminhamento prefixado de uma subárvore cuja raiz € o 
nodo v € apresentado no Trecho de código 7.8. Inicialmente, ativa-se esta rotina chamando 
preonder( T, T.root( )). 


Algoritmo preorden Tv): 
executa a ação associada a "visita" do nodo v 
para cada filho w de v em T faça 
preorder( Pw) [recursivamente percorre а subárvore enraizada em w} 


Trecho de código 7.8 Algoritmo preorder para executar um caminhamento prefixado sobre а 
subárvore T enraizada no nodo v. 


O algoritmo de caminhamento prefixado é útil para produzir uma ordenação linear dos nodos 
de uma árvore, na qual os pais devem aparecer antes dos filhos na ordenação. Tais ordenações 
têm diferentes aplicações; uma dessas aplicações será explorada no próximo exemplo. 


Exemplo 7.6 O caminhamento prefixado de uma drvore associada a um documento, como 
no Exemplo 7.3, examina o documento inteiro, seqüencialmente, do início ao fim. Se os nodos 
externos são removidos antes do cominhamento, ento o indice do documento é percorrido (ver 
a Figura 2.6) 


O caminhamento prelixado é uma forma eficiente de se percorrer todos os nodos de uma 
árvore, Para justificar essa afirmação, considere-se o tempo de execução do caminhamento 
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Figura 7.6 Caminbamento prefixado sobre uma árvore ordenada onde os filhos de cada nodo 
estão ordenados da esquerda para a direita. 


prefixado de uma árvore T com n nodos, considerando que a “visita” aos nodos consome tempo 
CM. A análise do algoritmo de caminhamento prefixado é semelhante a do algoritmo height? 
(Trecho de código 7.7), fornecido na Seção 7.2.1. Para cada nodo v, a parte não-recursiva do 
algoritmo de caminhamento prefixado requer tempo CNI + c), onde c, é o número de filhos 
de v. Desta forma, pela Proposição 7.5, 0 tempo total de execução do caminhamento prefixado 
de Té Om). 

O algoritmo toStringPreordert T. v), implementado em Java no Trecho de código 7.9, executa 
uma impressão prefixada da subárvore de um nodo v de T, isto é, executa o caminhamento pre- 
fixado da subárvore com raiz em v e imprime o elemento armazenado quando o nodo é visitado. 
Deve-se lembrar que, para uma árvore ordenada T. o método 7.children(v) retorna uma coleção 
iterável que acessa os filhos de v em ordem. 


public static <E> String toStringPreorder(Tree— E > T, Position E- v) ( 
String s = v.element( ).toString( |; principal ação de "visita" 
for (Position--E- w : T.children(v]) 
&4-", " + toStringPreorder(T, w); 
return 5; 


| 


Trecho de código 7,9 Método toStringPreorder( Tv) que executa uma impressão prefixada dos 
elementos na subärvore do nodo v de T. 


Existe uma aplicação interessante do algoritmo de caminhamento prefixado que produz uma 
representação string de uma árvore inteira. Assume-se novamente que para cada elemento e ar- 
mazenado na árvore T, a chamada e toString() retoma a string associado com e, A representação 
string usando parênteses P(T) de uma árvore T é recursivamente definida como segue. Se T 
consiste em um único nodo v, então 


P(T) = v.element( ).toString ). 
5e nào, 
РТ) = v.alament( ).taGtring( ] + "(e PF) ev," certo PUER nn, 


onde v é a raiz de Pe „Г... Г, são as subárvores com raiz nos filhos de v, os quais são forne- 
cidos em ordem se T for uma árvore ordenada. 

Observa-se que a definição de P(T) é recursiva. Além disso, está-se usando “+” para denotar 
concatenação de strings. À representação usando parênteses da árvore da Figura 7.2 é apresenta- 
da na Figura 7.7. 
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Figura 7.7 Representação usando parênteses da árvore da Figura 7.2. À indentação, as quebras 
de linha е os espaços foram adicionados por clareza, 


Observa-se que, tecnicamente falando, existem alguns cálculos que ocorrem antes е depois 
das chamadas recursivas nos filhos do nodo no algoritmo anterior, Considera-se, entretanto, esse 
algoritmo como sendo de caminhamento prefixado, uma vez que a ação principal de impressão 
do conteúdo do nodo ocorre antes das chamadas recursivas. 

Q método Java parentheticRepresentation. apresentado no Trecho de código 7,10, é uma 
variação do método toStringPreorder (Trecho de código 7.9). Ele implementa a definição for- 
necida anteriormente para gerar uma representação string usando parênteses de uma árvore T. 
Da mesma forma que o método toStringPreorder, o método parenthetichepresentation faz uso 
do método toString definido para todo objeto Java. Na verdade, podemos entender este método 
como um tipo de método toString( ) para objetos árvore. 


public static <E> String parenthetichepresentation{Tree<E> T, Position E= v) | 
String = = v.element( toString “ação principal de visita 
if (isInternai(v)) { 
Boolean firstTime = true; 
for (Position E> w ;: Tehildren(v]) 
if (firstTime) { 


5+=* { " + parentheticHepresentation(T, wi; # primeiro filho 
firstTime = false; 
} 
else s +=", * 4 parenthetichepresentatlondT, wi; // filhos seguintes 
&42" je: ¿echa parênteses 
| 
return 5; 


| 


Trecho de código 7.10 Algoritmo parentheticRepresentation. Observa o uso do operador "+" 
para concatenar duas strings. 


O Exercício R-7.9 explora uma modificação no Trecho de código 7. 10 para exibir uma árvo- 
re de forma mais próxima à usada na Figura 7.7. 


7.2.3 


Caminhamento pós-fixado 


Outro tipo importante de caminhamento em árvores é o caminhamento pós-fixado. Este algo- 
ritmo pode ser entendido como o oposto do caminhamento prefixado, porque primeiro percorre 
recursivamente as subárvores enraizadas nos filhos da raiz, € depois visita a raiz. É similar ao 
caminhamento prefixado, entretanto, na medida que usando o mesmo para resolver um deter- 
minado problema, especializa-se à ação associada com a “visitação” de um nodo v. Ainda, da 
mesma forma que o caminhamento prefizado, se a árvore for ordenada, as chamadas recursivas 
nos filhos de um nodo v são festas de acordo com sua ordem específica, O pseudocódigo para o 
caminhamento pós-fixado é apresentado no Trecho de código 7.11. 


Árvores 257 


Algoritmo postorder T v: 
para cada filho w de v em T faça 
postorder( Tw) [recursivamente percorre a subárvore enraizada em w) 
executa a “ação de visita” para o nodo v 


Trecho de código 7.11 Algoritmo postorder que executa um caminhamento pós-fixado sobre 
a subárvore da árvore T enraizada no nodo v, 


O nome do caminhamento pós-fixado vem do fato de que o caminhamento visitará o nodo v 
depois de ter visitado todos os outros nodos da subárvore com raiz em v (ver à Figura 7.8). 


Trabalhe final 


Referências 


Figura 7.8 Caminhamento pós-fixado sobre a árvore ordenada da Figura 7.6, 


A análise do tempo de execução de um caminhamento pós-fixado é análoga ao do caminha- 
mento prefixado (ver a Seção 7.2.2). O tempo total gasto nas porções não recursivas do algoritmo 
é proporcional ao tempo gasto na visitação dos filhos de cada nodo da árvore. Desta forma, um ca- 
minhamento pós-fixado de uma árvore T com n nodos leva tempo On), partindo do principio que a 
visita a cada nodo leva tempo СХТ). Ou seja, o caminhamento pás-fixado executa em tempo linear. 

Como exemplo de caminhamento pös-fixado, apresenta-se o método Tava toStringPostorder 
no Trecho de código 7,12, que executa o caminhamento pós-fixado de uma árvore T. Este método 
imprime o elemento armazenado no nodo quando ele é visitado. 


public static <E> String toStringPostorder(Tree< E> T, Position E >= wH 
String s= ""; 
for (Position<E> w : T.children{v)) 
в + = toStringPostorder(T. w) + = *: 
в += velement( |; // ação principal de visitação 
return 5; 
} 


Trecho de código 7.12 Método toStringPostorder(T v) que executa uma impressão pós-fixada 
dos elementos da subárvore do nodo v de T. O método chama toString implicitamente para cada 
elemento quando os mesmos estão envolvidos em operações de concatenação. 


O método de caminhamento pós-fixado é útil para resolver problemas em que se deseja 
calcular alguma propriedade para cada nedo v de uma árvore, mas o cálculo desta propriedade 
para v implica que se tenha calculado anteriormente a mesma propriedade para seus filhos. Um 
exemplo de tal aplicação é ilustrado a seguir. 


Exemplo 7.7 Considere-se a drvore T de um sistema de arquivos, cujos nodos externos represen- 
tam arquivos e os nodos internos representam diretórios (Exemplo 7.1). Supondo-se que se deseja 
calcular o espaço em disco usado por um diretório, o que é recursivamente definido pela soma do: 


258 Estruturas de Dados e Algoritmos em Java 


* —tamanho do diretório propriamente dito: 
e tamanhos dos arquivos armazenados no diretório; 
= espaço usado pelos diretórios filhos. 


(Ver Figura 7.9.) Este cálculo pode ser feito com um caminhamento pós-ficado sobre a dr- 
vore T. Depois que as subárvores de um nodo interno v forem percorridas, calcula-se o espaço 
usado por v, somando o tamanho do diretório v propriamente dito e o tamanho dos arquivos 
armazenados no próprio diretório v com o espaço usado por cada filho interno de v, que é calcu- 
lado pelo caminhamento pós- fado recursivo dos filhos de v. 


Um método recursivo em Java para calcular o espaço em disco 


Motivado pelo Exemplo 7.7. o algoritmo diskSpace, apresentado no Trecho de código 7.13, 
executa um caminhamento pós-fixado de uma árvore de um sistema de arquivos T, imprimindo 
o nome e o espaço em disco usado pelo diretório associado com cada nodo interno de T. Quando 
chamado a partir da raiz de 7, diskSpace executa em tempo Ar), onde rn é o número de nodos de 
Г, desde que os métodos auxiliares name e size executem em tempo CH I). 
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Figura 7.9 A árvore da Figura 7.3 representando um sistema de arquivos, mostrando o nome 
e o tamanho dos arquivos/diretórios associados a cada nodo e o espaço em disco usado para os 
diretórios associados à cada nodo interno, 
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public static <E= int diskSpace (Tree«-E-- T. Position Е v) [ 

int s = siza(v); ¿inicia com a tamanho do própria nodo 

for (Position<E= w: T.children(v) 
/f acrescenta o espaço ocupado pelos filhos de v calculado recursivamente 
в += diskSpaceiT, мү 

if (T isInternal(vh | 
imprime o nome e o espaço ocupado em disco 
System.out.printiname(v) +": " +s); 
| 


return 5, 


| 


Trecho de código 7.13 O método diskSpace imprime o nome e o espaço em disco ocupado 
pelo diretório associado com cada modo interno de uma árvore de um sistema de arquivos. Este 
método aciona os métodos auxiliares name e size, que são implementados de maneira a retornar 
o nome e o tamanho de um arquivo diretório associado com um nodo, 
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Qutros tipos de caminhamentos 


Apesar de caminhamentos prefixados e pós-fixados serem as formas mais comuns de se percor- 
rer os nodos de uma árvore, é possível imaginar outros caminhamentos. Por exemplo, pode-se 
percorrer uma árvore de forma a visitar todos os nodos de profundidade d antes de visitar os 
nodos de profundidade d+ 1. Numerar os nodos de uma árvore T em segiiência, a medida em 
que são visitados neste caminhamento, resulta na chamada numeração dos níveis dos nodos de 
T (ver Seção 7.3.5). 


7.3 Arvores binárias 
Uma árvore binária é uma árvore ordenada com as seguintes propriedades: 


* Todos os nodos têm no máximo dois filhos. 
* Cada nodo filho é rotulado como sendo um filho da direita ou um filho da esquerda, 
+ О filho da esquerda precede o filho da direita na ordenação dos filhos de um nodo. 


A subárvore enraizada no filho da direita ou no filho da esquerda de um nodo interno v é 
chamada de subárvore direita ou subárvore esquerda de y, respectivamente. Uma árvore binária 
é própria se cada nodo tem zero ou dois filhos. Algumas pessoas também se referem a estas dr- 
vores, como árvores binárias cheias. Logo, em uma árvore binária própria todo nodo interno tem 
exatamente dois filhos. Uma árvore binária que não é própria é imprópria. 


Exemplo 7.8 Uma importante classe de drvores binárias se aplica no contexto em que se pre- 
tende representar um conjunto de diferentes resultados a partir das respostas a uma série de 
questões do tipo sim ou não. Cada nodo interno é associado com uma questão, Começando pela 
raiz, avanca-se pelo filho da direita ou pelo filho da esquerda do nodo corrente, dependendo se 
a resposta para a questão for "sim" ou "ndo". Em cada decisão, segue-se uma aresta de um pai 
para um filho, definindo um caminho sobre a árvore da raiz até um nodo externo. Tais drvores 
bindrias são conhecidas como árvores de decisão, porque cada nodo externo v deste tipo de dr- 
vore representa uma decisão dependente das respostas que foram dadas às questões associadas 
com os ancestrais de v. À Figura 7,10 apresenta uma árvore de decisão que fornece recomenda- 
ções para um investidor prospectivo, 


Wocé é estressado” 


NODE val precisar de dinheiro nos 
próximos 5 anos? 


Você aceita correr nacos na transagao 
em troca de ganhos maiores? 


" = Carteira diversificada com ações, 
Carteira de ações E А | 
títulos е aplicações de curto prazo 


Figura 7.10 Árvore de decisão que fornece dicas de investimento. 
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Exemplo 7.9 Uma expressdo aritmética pode ser representada por uma drvore bindria cujos 
nodos externos são associados com varidveis ou constantes e cujos nodos internos são associa- 
dos com um dos operadores +, =, X ef (ver Figura 7.11). Cada nodo deste tipo de drvore tem 
um valor associado. 


• Seonodo é externo, seu valor é о de sua varidvel ou constante. 
* Seo nodo é interno, então seu valor é definido aplicando-se sua operação sobre o valor 
de seus filhos. 


Lima ärvore de expressão aritmética é uma drvore binária própria, pois cada operador +, 
‚Же tem exatamente dois operandos. Naturalmente, se forem permitidos operadores undrios, 
como negação (— ), como em “—x", então se pode ter uma árvore imprópria. 


Figura 7.11 Uma árvore binária representando uma expressão aritmética, Esta árvore repre- 
senta a expressão ((((3 + 1) = 3)/((09 — 5) + 29) — (3 = (7 — 49) + 6)). О valor associado com 
o nodo interno rotulado com "^ é 2, 


Definição recursiva de árvore binária 


Conseguentemente, também se pode definir uma árvore binária de maneira recursiva, de maneira 
que uma árvore binária ou é vazia ou consiste em: 


+ Um nodo r chamado raiz de T e que armazena um elemento. 
* Uma árvore binária chamada de subärvore esquerda de T. 
* Uma árvore binária chamada de subárvore direita de T. 


Na sequência, serão discutidos alguns tópicos específicos de árvores binárias. 


O TAD árvore binária 


Como tipo abstrato de dados, uma árvore binária é uma especialização da árvore que suporta 
quatro métodos de acesso adicionais: 
left(v): Retorna o filho da esquerda de v; ocorre uma condição de erro se v não 
tiver filho da esquerda. 


right(v): Retorna o filho da direita de v; ocorre uma condição de erro se v não 
tiver filho da direita, 


hasLeft(v) Testa se v tem um filho da esquerda. 
hasRigth(v): Testa se v tem um filho da direita. 
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Neste caso, como na Seção 7.1.2 para o TAD árvore, não se define métodos especializados 
para a atualização de árvores binárias, Em vez disso, consideram-se alguns métodos de atualiza- 
ção quando se descrevem implementações e aplicações específicas de árvores binárias. 


7.3.2 Uma interface de árvore binária em Java 


Modela-se uma árvore binária como um tipo abstrato de dados que estende o TAD árvore с acres- 
centa três métodos especializados para árvores binárias. No Trecho de código 7.14, apresenta-se 
uma interface Java simples definida usando-se esta abordagem. Á propósito, uma vez que árvores 
binárias são árvores ordenadas, a coleção iterável retornada pelo método children(+) (herdado da 
interface Tres) armazena o filho da esquerda de v antes do filho da direita. 
J* + 
+ Uma interface para árvores binárias onde cada nodo tem zero, um ou dois filhos. 
+ 

public interface BinaryTree<E> extends Tree E > | 

/** Retoma o filho da esquerda do пода. */ 

public Fasiton<E> leftiPasition--E- v) 

throws InvalidPositionException, BoundaryViolationException:; 
/** Retorna o filho da direita do nodo. */ 
public FositionE- rightiPosition=E= v) 
throws InvalidPositionException, BoundaryViolationException; 

/** Retorna se o nodo tem filho da esquerda. */ 

public boolean hasLeft(Position-- E> v) throws InvalidPositionException: 

/** Retorna se o nado tem filho da direita, */ 

public boolean hasRightiPosition-- E= v) throws InvalidPositionException; 
} 


Trecho de código 7.14 Interface Java BinaryTree para o TAD árvore binária. A interface Bina- 
ryTree estende a interface Tree (Trecho de código 7.1). 


73.3 Propriedades de árvores binárias 


As árvores binárias têm várias propriedades interessantes quanto às relações entre sua altura е 
número de modos. Denota-se o conjunto de nodos de mesma profundidade d de uma árvore T 
como sendo o nivel d de T. Em uma árvore binária, o nível O tem no máximo um nodo (a raiz), o 
nível 1 tem no máximo 2 (os filhos da raiz)», o nível 2 tem no máxima 4, e assim por diante (ver a 
Figura 7.12). Generalizando, pode-se dizer que o nivel d tem no máximo 2" nodos. 

Pode-se observar que o número máximo de nodos nos níveis de uma árvore binária cresce de 
forma exponencial à medida que se desce na árvore. A partir desta observacáo, podem-se derivar 
as seguintes propriedades relacionando a altura de uma árvore binária T com o número de nodos. 
Uma cxplicação detalhada dessas propriedades fica como exercicio (R-7.15). 


Proposição 7.10 Seja T uma drvore binária nüo-vazia que faga n, ny. n,e hrdenotarem o nime- 
ro de nodos, mimero de nodos externos, número de nodos internos e altura de T, respectivamente. 
Então T tem as seguintes propriedades: 


h-1zsnz2"! -i 

І = л. = 2" 
hzsnz2-l 

logía + 1) - 1 Sh sn- I. 
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Nivel Nodos 
0) | 
1 2 
2 4 
3 8 


Figura 6.12. Número máximo de nodos nos níveis de uma árvore binária. 


Além disso, se Té própria, aplicam-se as seguintes propriedades: 


3 hens? - 1 
4. logía + D)—1 Sh s (n = 102, 


Relacionando nodos internos com nodos externos 
em uma árvore binária própria 


Além das propriedades de árvore binária apresentadas, existem também as seguintes relações 
entre o número de nodos internos e o número de nodos externos em uma árvore binária própria. 


Proposição 7.11 Em uma drvore binária propria T, com n, nodos externos € n, nodos internas, 

têm-se gue ne = m + l. 

Justificativa Justifica-se essa proposição removendo os nodos de T e dividindo-se os mesmos 

em dois “montes”: o monte de nodos internos e o monte de nodos externos, até que T fique vazia. 

As pilhas estão inicialmente vazias, No final, o monte de nodos externos terá um nodo a mais que 

o monte de nodos internos. Consideram-se dois casos: 

Caso I: Se T tem apenas um nodo v, remove-se v, que é colocado no monte de nodos externos. 
Assim, o monte de nodos externos terá um nodo e o monte de nodos internos estará vazio, 

Caso 2: Por outro lado, (T tem mais de um nodo) remove-se de T um nodo externo (arbitrário) w 
e seu pai v, que é um nodo interno. Coloca-se w no monte de nodos externos e v no monte de 
nodos internos. Se v tem um pai u, então se reconecta и com o primeiro irmão z de w, como 
pode ser visto na Figura 7.13. Esta operação remove um nodo interno e um nodo externo е 
mantém a árvore como sendo uma árvore binária própria. 

Repetindo esta operação, mais cedo ou mais tarde restará uma árvore com apenas um 
nodo. Observa-se que o mesmo número de nodos internos e externos foi removido e coloca- 
do em seus montes respectivos pela sequência de operações que resultou nesta árvore final, 
Agora, remove-se o nodo da árvore final e coloca-se o mesmo no monte de nodos externos, 
Assim, o monte de nodos externos terá um nodo a mais que o monte de nodos internos. 

и 
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Figura 7.13 Operação que remove um nodo externo € seu pai, usada na justificativa da Propo- 
sição 7.11. 


Observa-se que a relação anterior não se aplica, normalmente, para árvores binárias im- 
próprias e árvores nào-binárias, apesar de que existem outras propriedades interessantes que se 
aplicam, como será investigado no Exercicio C-7.7. 


7.34 Estruturas encadeadas para árvores binárias 


Da mesma forma que para uma árvore genérica, a forma mais natural de implementar uma árvore 
binária T ё usar uma estrutura encadeada, em que se pode representar cada nodo v de T usando 
um objeto posição (ver Figura 7.14a) com campos provendo referências para os elementos arma- 
zenados em v e as objetos posição associados com os filhos e pais de v. Se v é a raiz de T. então 
o campo parent de v é nulo, Se v nào tem o filho da esquerda, então o campo left de v é nulo. Se v 
não tem filho da direita, então o campo rigth de v é nulo, Armazena-se, também, a quantidade de 
nodos de Tem uma variável chamada size. Apresenta-se uma representação da estrutura encade- 
ada de uma árvore binána na Figura 7.146, 


Implementação Java de um nodo de árvore binária 


Usa-se a interface Java BTPosition (não mostrada) para representar um nodo de árvore binária. 
Esta interface estende Position, logo herda o método element. e possui métodos adicionais para 
definir o elemento armazenado no nodo (setElement) e para definir e retornar o filho da esquerda 
(setLeft e getLeft}, da direita (setRight e getRight) e o pal (setParent e getParent) do nodo, A 
classe BTNode (Trecho de código 7.15) implementa a interface BTPosition por meio de um obje- 
to que tem os campos element, left, right e parent, que, para um nodo v, referenciam o elemento 
de v, o filho da esquerda de v, o filho da direita de v e o pai de v, respectivamente. 


Per 
* Classe que implementa um nodo de árvore binária armazenando referencias para um 
* elemento, o nodo pai, o nodo da direita e o nodo da esquerda. 
+y 
public class BTNode<E> implements BTPosition<E= | 
private E element; — // alemento armazenado neste nodo 
private BTPosition<E> left. right. parent; — // nodos adjacentes 
/** Construtor principal */ 
public BTModeiE element, BTPostion<E> parent, 
BTPosition<E=> left, BTPosition- E> right) [ 
setElementielement); 
setParentiparent); 
setLeftileft); 
setRightirighti; 
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/** Retorna o elemento armazenado nesta posição */ 
public E elementi | { return element; } 

/** Define o elemento armazenado nesta posição */ 
public void setElementiE o) [ element=o; ) 

/** Retorna o filho da esquerda desta posição */ 
public BTPosition<E= getLefti ) ( return left; ) 

/** Define o filho da esquerda desta posição */ 
public void setLet(BTPosition Е: v] 4 left=w; | 

/** Retorna o filho da direita desta posição */ 

public BTPosition=E = getRight( | { return right; } 

¿2 Define o filho da direita desta posição */ 

public void setRightiBTPosition<E> v) { rightzv; | 
¿22 Retoma o pai desta posição ^/ 

public BTPosition<E=- qetParent( ) { return parent: } 
/** Define o pai desta posição */ 

public void setParent(BTPosition-E-- v) | parent=v; | 


} 
Trecho de código 7.15 Classe auxiliar BTNode usada na implementação de nodos de árvores 
binárias, 
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Figura 7.14 Um (a) nodo e (b) uma estrutura encadeada para representar uma árvore binária. 
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Implementação Java de uma estrutura encadeada para árvore binária 


Nos Trechos de código 7.16 = 7.18, são apresentadas partes da classe LinkedBinary Tree, que 
implementa a interface BinaryTree (Trecho de código 7.14) usando uma estrutura de dados en- 
cadeada. Esta classe armazena o tamanho da árvore e uma referência para o objeto BTNode 
associado com a raiz da árvore em variáveis internas. Além dos métodos da interface BinaryTree, 
LinkedBinaryTree tem vários outros métodos, incluindo o método de acesso sibling(v) que retorna 
o irmão de um nodo v além dos seguintes métodos de atualização: 


addRoot(r): cria e retorna um nodo novo, ғ, que armazena o elemento e e torna ra 
raiz da árvore; um erro ocorre se a árvore não está vazia. 
insertLeft(v,e): cria e retorna um nodo novo, w, que armazena o elemento e, acrescenta 
w como o filho da esquerda de v e retorna w; um erro ocorre se v já tem 
um filho da esquerda. 


insertRight(w,e): cria e retorna um nodo novo, 2, que armazena o elemento e, acrescenta 
z como o filho da direita de v e retorna z; um erro ocorre se v já tem um 
filho da direita. 


remove v): remove o nodo v, subsbtuindo-o por seu filho, se houver algum, e retor- 
na o elemento armazenado em v; um erro ocorre se v tem dois filhos. 


attachí(v,7,.T.): conecta TT, respectivamente, como as subárvores da esquerda e da 
direita no nodo externo v; uma condição de erro se verifica se v não é 
EALEÉTIMO, 


A classe LinkedBinaryTree tem um construtor sem argumentos que retorna uma ärvore bi- 
папа vazia. À partir desta árvore vazia, pode-se construir qualquer árvore binária criando-se o 
primeiro nado com o método addRoot e aplicando repetidamente os métodos insertLaft e insert- 
Right. além do método attach. Da mesma forma, pode-se desmantelar qualquer árvore binária T 
usando à operação remove, resultando em uma árvore binária vazia. 

Quando uma posição v é passada como argumento para um dos métodos da classe Linked- 
Binary Tres, sua validade é verificada chamando-se um método auxiliar, checkPosition(v). Uma 
lista de nodos visitados em um caminhamento prefixado é construída usando-se o método recur- 
sivo preorderPositions. Condições de erro são indicadas lançando-se as exceções InvalidPosition, 
BoundaryViolationexception, Empty TreeException e NonEmptyTreeException. 
pex 

* Implamentação da interface BinaryTree usando uma estrutura encadeada. 
hy 
public class LinkedBinan,Tree<E> implements Binary Tree<E> { 
protected BTPosition<E> root; — // reterencia para a raiz 
protected int size; її numero de nodos 
/** Спа uma árvore binária vazia. */ 
public LinkedBinaryTree( ) | 
root = null; “inicia com uma árvore vazia 
size = 0, 
) 
/** Retorna o número de nodos da árvore. */ 
public int size( ) { 
return size: 
| 
/** Retorna se um nodo é interno. */ 
public boolean islnternal(Position-E - v) throws InvalldPositionException [ 
checkPosition(v); // método auxiliar 
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return (азем) | | hasRightiw); 


/** Retorna se um nodo é a raiz. */ 

public boolean isRoot(Position=E> v) throws InvalidPositionException | 
checkPosition(v); 
return (v == root ); 


| 
/** Retorna se um nodo tem o filho da esquerda. */ 
public boolean hasLeftíPosition<E> v) throws InvalidPositionException ( 
BTPosition<E> vv = checkPosition(w); 
return (vv.getLeft( ) != null); 
) 
/** Retorna a raiz da árvore. */ 
public Position<E> root( ) throws EmptyTreeException { 
if (root == null) 
throw new EmptyTreeException(*The tree is empty"); 
return root; 
} 
/** Retoma o filho da esquerda de um nodo. */ 
public Position<E> left(Position- Е v) 
throws InvalidPositionException, BoundaryViolationException | 
BTPosition<E> vv = checkPosition(v); 
Position Е leftPos = vv.getLeft( ); 
if (leftPos == null) 
throw new BoundaryViolationException("No left child"); 
return leftPos; 
} 


Trecho de código 7.16 Parte da classe LinkedBinary Tree que implementa a interface Binary Tres 
(continua no Trecho de código 7.17). 


/** Retorna o pai de um nodo. */ 
public Position E- parent{Position<E> v) 
throws InvalidPositionException, BoundaryVialationException { 
BTPosition<E> vv = checkPosition(w); 
Position<E> parentPos = vv.getParent( ); 
if iparentPos == nul) 
throw new BoundaryViolationException("No parent") 
return parentPos; 


} 
"+ Retoma uma colação iterável contendo os filhos de um nodo. */ 
public Itarabla=Position=E=> children(Position<E> v) 
throws InvalidPositionException [ 
PositionList<Position<E>> children = new NodePositionList «Position «E - -( |; 
if (hasLeftiv)) 
children.addLast(leftiv)); 
if (hasRight(v)) 
children.addL astiright(v)): 
return children; 


) 

/** Retorna uma colação iterável contendo os nodos da árvore. */ 

public Iterable-—Position-—E- - positions( ) { 
PositionList= Position <E>> positions = new ModePositionList —Position « E= -( J; 
if(size != 0) 
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= 


preorderPositions(root ), positions); // atribui as posições usando caminhamento prefixado 
return positions; 


} 
/** Retorna um iterador sobre os elementos armazenados nos nodos */ 
public Rerator<E:> iterator ) [ 
Iterable-- Position E> > positions = positionsí ); 
PositionList<E> elements = new NodaPositionList<E=( y 
for (Position<E> pos: positions) 
elaments.addl ast(pos.elementi |); 
return elements iterator j; “ Um iterador sobre os elementos 


| 
/** Substitui o elemento armazenado no nodo. */ 
public E replace(Position<E> v, E a) 
throws InvalidPositionException { 
BTPosition —E- vv = checkPosition(v); 
E temp = velement( |; 
vw. setElement(o); 
return temp; 
) 


Trecho de código 7.17 Рале da classe LinkedBinaryTree que implementa a interface Binary Tres 
(continua no Trecho de código 7.18). 


ff Método de acesso adicional 
/** Retorna o irmão de um nodo */ 
public Position<E> sibling(Position--E- v) 
throws InvalidPositionException, BoundaryViolationException | 
BTPosition<E> vv = checkPosition(v): 
BTPosition c E> parentPos = vv.getParenti); 
if (parentPos !- null) { 
BTPosition<E> sibPos; 
BTPosition<E> leftPos = parentPos.getLefti ); 
if (leftPos == vv) 
sibPos = parentPos.getHightl ); 
else 
sibPos = parentPos.getL eft(): 
if (sibPos |= null) 
return sibPos; 
} 
throw new BoundaryViolationException(^No siblina") 
} 
// Métodos de acesso adicionais 
1** ingere a raiz em uma árvore vazia */ 
public Position Е addRoot(E e) throws NonEmptyTreeException { 
iftisEmptyt 9) 
throw new MonEmptyTreeExceptionl"Tree already has a root"); 
size = 1; 
root = createMode(a null null null: 
return root; 


} 

PU [nsere o filho da esquerda em um nodo. */ 

public Position<E> insertLeftíPosition<E> v, E e) 
throws InvalidPositionException | 
BTPosition<E> vv = checkPositioniv); 
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i; 


Position=E> leftPos = зу. пей efti |: 
if (leftPas !- null) 
throw new InvalidPositionException("Node already has a left child"); 
BTPosition<E> ww = createModete, vv, null, null); 
vv. еей: 
Size; 
ratur ww: 


Trecho de código 7.18 — Parte da classe LinkedBinaryTree que implementa a interface BinaryTree 
(continua no Trecho de código 7.15). 


/** Remove um nodo com zero ou um filho. */ 
public E remove(Position<E> v) 


throws InvalidPositionException [ 
BTPosition<E> үү = checkPosition(wk 
BTPosition<E> leftPos = vv.getL aft( |: 
BTPosition<E> rightPos = vv.getRighti ); 
# (leftPos !— null 44 rightPos !— null) 
throw new InvalidPositionException(*Cannot remove node with two children"; 
BTPositioncE- ww; “fo único filho de v, se houver 
if (laftPos le null) 


ww = leftPos; 

else if (rightPos !- null) 
WW = rightPos; 

else K v é folha 
ww = null; 


И (чу root) Sva raz 
if (ww !— null) 
ww,setParentinull; 
root = ww; 
! 
else [ // v não é a raiz 
BTPosition<E> uu = vv.getParent( }; 
if (vv == uu.getLefti )) 
uu.seiLeftiww); 
else 
uu.setRight(ww); 
few |= null) 
vw. setParent/uul; 
| a 
size —; 
retum v.elementi |; 


Trecho de código 7.19 Parte da classe LinkedBinaryTree que implementa a interface Binary Tree 
(continua no Trecho de código 7,20). 


/** Conecta duas árvores para serem subárvores de um nodo externo. */ 
public void attachíPosition<E> v, Binary Tree<E > T1, BinaryTree<E> T2) 


throws InvalidPositionException { 
BTPosition--E- vy = checkPosition(v]; 
if (isInternal(v]) 
throw new InvalidPositionExceplion("* Cannot attach from internal node"); 
if (T1 isEmptyi Wf 
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BTPosition=E=> r1 = checkPosition(T1.root( y); 
vy.setLaft(r1); 
r1.satParent(vv]; ¿TI deve ser invalidada 


if (T2 isEmptyt |) 1 
BTPositon<E> r2 = checkPosition(T2.root( ||; 
vv.setRightír2]; 
re setParentivv); і! T2 deve ser invalidada 
} 
| 
/** Se v é um nodo de árvore binária, converte para BTPosition, caso contrário lança exceção */ 
protected BTPosition<E> checkPosition(Position-E-- v) 
throws InvalidPositionException { 
if (v == null || Kv instanceof BTPosition)) 
throw new InvalidPositionException(" The position is invalid") 
return (BTPosition E) v; 
} 
PR Cria um novo nodo de árvore binária */ 
protected BTPosition<E = createMode[E element, BTPosition<E= parent, 
BTPosition<E> left, BTPosition<E> right) ( 
return new BTNode=E-=(alement, parent, left right): ) 
rer Cria uma lista que armazena os nodos da subárvore de um nodo ordenados de acordo 
* com o caminhamento prefixado da subárvore, */ 
protected void preorderPositions(Position=E> v, PositionList--Position-E- > pos) 
throws InvalidPositionException ( 
pos.addLastiv); 
if (hasLeft(v)) 
preorderPositionsileftiv, pos); //recursao sobre o filho da esquerda 
if (hasRight(v)) 
preorderPositions(rightiv), pos); // racursáo sobre o filho da direita 
} 


Trecho de código 7.20 Parte da classe LinkedBinaryTree que implementa a interface Binary Tree 
(continuação do Trecho de código 7.19). 


Performance da implementação de LinkedBinary Tree 


Serão analisados agora os tempos de execução dos métodos da classe LinkedBinary Tree, que usa 
uma representação através de lista encadeada: 


“Os métodos size( ) e is Empty) usam uma variável de instância para armazenar o número 
de nodos de T, e cada um consome tempo CN ]). 

+ Ds métodos de acesso root, left, right, sibiling e parent consomem tempo Gill. 

+ О método replace(v.e) consome tempo CH I). 

* Os métodos iterator| ) e positions( ) são implementados usando-se caminhamento prefixa- 
do sobre a árvore (usando o método auxiliar preorderPositions). Os nodos visitados por 
este caminhamento são armazenados em uma lista de posições implementada usando-se 
a classe NodePositionList (Seção 6.2,4) e o iterador resultante é criado com o método 
iterator ) da classe NodePositionList. 

* Os métodos iterator ) e positions( | consomem tempo Om) e os métodos hasMext( ) e next } 
do iterador retornado executam em tempo Ol). 

* O método children usa uma abordagem similar para construir e retornar uma coleção ite- 
rável, mas executa em tempo Of 1), uma vez que existem no máximo dois filhos por nodo 
em uma árvore binária. 


Zn 
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* Os métodos de atualização insertLeft, insertRight, attach e remove todos executam em 
tempo CO 1). na medida em que envolvem manipulações de tempo constante de um núme- 
ro constante de nodos. 

Considerando o espaço requerido por esta estrutura de dados para uma árvore de n nodos, 
observa-se que existe um objeto BTNode (Trecho de código 7,15) para cada nodo da árvore T. 
Logo, o espaço total necessário é On). A Tabela 7.2 resume a performance da implementação 
usando estrutura encadeada de uma arvore binária. 


Operação 


Tempo | 


iterato, positions 


piace 
root, parent, children, left, right, sibling 
hasLeft, hasRight, isinternal, isExternal, isRaot 


insertLeft, insertRight, attach, гегпоме EM by 


Tabela 7.2 Tempos de execução para os métodos de uma árvore binária com a nodos imple- 
mentada usando uma estrutura encadeada. Os métodos hasNext() e next( dos iteradores retor- 
nados por iterator( ), positions )iterator( ) e children(v).iterator( | executam em tempo Ol). O 
espaço consumido é Ch). 


Uma estrutura baseada em lista arranjo para árvores binárias 


Uma alternativa para representar uma árvore binária T é baseada em uma forma de numerar os 
nodos de T. Рага cada nodo v de T, faga pv) ser um inteiro definido como segue. 


в Sevéa raiz de T. então piv) = 1. 
+ Sevéo filho da esquerda do nodo м, então pv) = Ian). 
æ Sevéo filho da direita do nodo m, então plv} = 2piu) + 1. 


A função de numeração p é conhecida como numeradora por nível dos nodos de uma árvore 
binária T, na medida em que numera os nodos de cada nível de T em ordem crescente, da esquer- 
da para a direita, embora possa pular alguns números (ver a Figura 7.15). 

A função numeradora por nivel p sugere uma representação para uma árvore binária T através 
de um vetor 5, em que cada nodo v de T é associado com um elemento de 5 em um indice piv). 
Como mencionado no capítulo anterior, implementa-se o vetor 5 usando-se um arranjo extensível 
(veja a Seção 6.1.4). Tal implementação é simples e eficiente, pois permite executar os métodos 
root, parent, left, right, hasLeft, hasRight, isinternal, isExternal e isRoot com facilidade, usando 
apenas operações aritméticas simples sobre os números piv) associados com cada nodo v envolvi- 
do na operação, Os detalhes de tal implementação ficam como um exercício simples (R-7,26). 

A Figura 7.16 apresenta um exemplo de representação usando lista arranjo de uma árvore 
binária. 

Faz-se n ser o número de nodos de Pe poser o valor máximo de piv) considerando todos os 
nodos de T. O vetor 5 tem tamanho № = py + 1, uma vez que o elemento de $ na colocação O não 
está associado com nenhum nodo de T. Além disso, o vetor $ terá, normalmente, uma certa quan- 
tidade de elementos vazios que não se referem a nenhum dos nodos existentes de 7, Na verdade, 
no pior caso, N = 2", cuja justificativa fica como exercício (R- 7.23). Na Seção 8.3. estuda-se uma 
classe de árvores binárias chamadas de heaps para as quais N = n + 1. Sendo assim, em vez do 
pior caso de consumo, existirão aplicações em que a representação por vetor de uma árvore biná- 
ria será eficiente em termos de espaço. Porém, considerando árvores binárias genéricas, o custo 
exponencial do pror caso de necessidade de espaço desta representação será exorbitante. 
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(a) 


Figura 7.15 Numeração por níveis de uma árvore binária: (a) esquema geral; (b) um exemplo. 


A Tabela 7.3 resume os tempos de execução dos métodos de uma árvore binária implemen- 
tada usando uma lista arranjo. Não são incluídos nesta tabela os métodos de atualização de uma 
árvore binária. 


img | 00) | 
eos positions | 00) | 
root parent, chidren, eft, night | OC | 
| hasteft hasRight, isintemal, isExtemal,isRoot | OC) | 


Tabela 73 Tempos de execução dos métodos de uma árvore binária T implementada usando 
uma lista arranjo 5. Denota-se número de nodos de T com n, e N denota o tamanho de 5. O con- 
sumo de espaço é (MN) e corresponde a 02”), no pior caso. 


"mua momo mam 


Figura 7.16 Representação de uma árvore binária T usando uma lista arranjo 5. 
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7.3.6 | Caminhamentos sobre árvores binarias 


Da mesma forma que com árvores genéricas, os cálculos executados sobre árvores binárias com 
frequência envolvem o caminhamento sobre árvores. 


Construindo a arvore de uma expressão 


Considere-se o problema de construir a árvore correspondente a uma expressão a partir de uma 
expressão aritmética totalmente entre parênteses de tamanho n. (Recorde-se do Exemplo 7.9 e 
do Trecho de código 7,24.) No Trecho de código 7.21, apresenta-se o algoritmo buildExpression, 
que спа este tipo de árvore, assumindo que todas as operações aritméticas são binárias e que as 
variáveis não estão entre parênteses. Logo, toda subexpressio entre parênteses contém um opera- 
dor no meio. O algoritmo usa uma pilha 5 enquanto percorre à expressão de entrada É procuran- 
do por variáveis, operadores e “fecha parênteses”. 


* Quando se encontra uma variável ou operador x, cria-se uma árvore binária de um nodo 7 
cuja raiz armazena x, e insere-se 7 na pilha, 

= Quando se encontra um “fecha parênteses”, CP retiram-se as trés árvores do topo da pilha 
5 que representam a subexpressão (E, o £). Conectam-se, então, as árvores de E, e Ena 
árvore de c, e insere-se o resultado novamente па pilha $. 


Repete-se este procedimento até que a expressão E tenha sido processada, quando o elemen- 
to do topo da pilha seja a árvore da expressão E. O tempo total de execução é Gar). 


Algoritmo buildExpressioni EY. 
Entrada: Uma expressão aritmética totalmente parentetisada 6 = €, Eos … e, p com cada 
e, sendo uma vartável, operador ou símbolo de parênteses 
Saida: Uma árvore binária 7 que representa à expressão aritmética E 
5 «— uma pilha nova vazia 
para г e 0 até n— | faça 
see, é uma varidvel ou um operador então 
T — uma nova árvore binária vazia 
FaddRootie ) 
S.push( T) 
sendo se à = (entáo 
Continua o laço 
sendo fe = "Y! 


T, + S.pop() [a árvore representando Æ; | 
T = 5 pop) [а árvore representando o | 
T,  5.pop() [a árvore representando E, | 
T.attach( T.root( ). T. P.) 

$ pushi T) 


retorna 5.popd | 
Trecho de código 7.21 — Algoritmo buidExpression. 


Caminhamento prefixado de uma árvore binária 


Lima vez que qualquer árvore binária pode ser vista como uma árvore genérica, o caminhamento 
prefixado para árvores genéricas (Trecho de código 7.8) pode ser aplicado a qualquer árvore 
binária. Pode-se simplificar, entretanto, o algoritmo no caso de caminhamento sobre árvores 
binárias. como se mostrou no Trecho de código 7,22, 
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Algoritmo binaryPreorderi fv): 
executa a ação prevista para o nodo v 
se v tem um filho da esquerda u em 7 então 


binaryPreorden Fu) [recursivamente percorre a subárvore esquerda | 
se v tem um filho da direita w em Tentäo 
binaryPreorderi 7, w) [recursivamente percorre a subärvore direita) 


Trecho de código 7,22 Algoritmo binaryPreorder que executa caminhamento prefixado em 
uma subärvore de uma árvore binária T com raiz no nodo v, 


Como no caso de árvores genéricas, existem muitas aplicações para o caminhamento prefi- 
xado sobre árvores binárias. 


Caminhamento pós-fixado sobre árvores binárias 


De forma análoga, o caminhamento pós-fixado para árvores genéricas (Trecho de código 7.11) 
pode ser especializado para árvores binárias como mostrado no Trecho de código 7.23, 


Algoritmo binaryPostorderi TY. 
se v tem um filho da esquerda u em Tentäo 


binaryPostorder 7,4) | recursivamente percorre a subärvore esquerda | 
se v tem um filho da direita w em T então 
binaryPostorderi Tw} [recursivamente percorre a subárvore direita } 


executa а ação prevista рага o nodo v 


Trecho de código 7.23 Algoritmo binaryPostorder que executa um caminhamento pós-fixado 
sobre uma subárvore de uma árvore binária T com raiz no nodo v. 


Avaliação de uma árvore de expressão 


O caminhamento pós-fixado de uma árvore binária pode ser usado para resolver o problema de 
avaliação de expressões. Neste problema, dada a árvore de uma expressão aritmética, ou seja, 
uma árvore binária na qual para cada nodo externo existe um valor associado e para cada nodo 
interno se associa um operador aritmético (ver Exemplo 7.9), deseja-se calcular o valor da ex- 
pressão aritmética representada pela árvore. 

O algoritmo evaluateExpression, indicado no Trecho de código 7.24, avalia a expressão 
associada com a subárvore com raiz no nodo v de uma árvore T que representa uma expres- 
são aritmética, executando um caminhamento pös-fixado T que se inicia em v. Neste caso, a 
ação "de visita" sobre cada nodo consiste na execução de uma operação aritmética simples. 
Observa-se que se explora o fato de que uma árvore de expressão aritmética é uma árvore 
binária própria. 


Algoritmo evaluateExpression Tv): 

Se v é um nodo interno de T então 
seja o o operador armazenado em v 
x — evaluateExpression( T, T left vi) 
у += evaluateExpression( T, T right( vy) 
retorna x © y 

seno 
retorna o valor armazenado em v 


Trecho de código 7.24 Algoritmo evaluateExpression para calcular a expressão representada 
pela subárvore de uma árvore T que representa uma expressão aritmética, enraizada no nodo v. 
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А aplicação de caminhamento pós-fixado na avaliação de expressões aritméticas resulta em 
um algoritmo que executa em tempo Cr) para avaliar uma expressão aritmética representada 
por uma árvore binária de n nodos. Na verdade, da mesma forma que o caminhamento pós-fi- 
tado genérico, o caminhamento pós-fixado para árvores binárias pode ser aplicado para outros 
problemas “bottom-up” (como, por exemplo, o problema de cálculo do tamanho apresentado no 
Exemplo 7.7), 


Caminhamento interfixado para árvores binárias 


Um método de caminhamento adicional para uma árvore binária é o caminhamento interfixado*. 
Neste método, visila-se o nodo entre os caminhamentos recursivos das subárvores direita e esquer- 
da, O caminhamento interfixado da subärvore com raiz no nodo v da árvore binária T é fornecido 
no Trecho de código 7.25. 


Algoritmo inorder Tv): 
se v tem um filho da esquerda n em 7 entào 
inorder(T,u) (percorre recursivamente a subárvore esquerda | 
execute a ação “de visita” sobre o nodo v 
se v tem um filho da direita w em Tentäo 
inorder T, w) {percorre recursivarente a subárvore direita} 


Trecho de código 7.25 Algoritmo inorder para executar o caminhamento interfixado da subär- 
vore com raiz no nodo v da árvore binária T. 


O caminhamento interfixado sobre uma árvore binária 7 pode ser informalmente considera- 
do como a visita aos nodos de T "da esquerda para a direita”. De fato, para cada nodo v, o cami- 
nhamento interfixado visita v após todos os nodos da subárvore esquerda de v e antes de visitar 
todos os nodos da subárvore direita de v (ver Figura 7.17). 


Figura 7.47  Caminhamento interfixado sobre uma árvore binária, 


Árvores binárias de pesquisa 


Seja $ um conjunto cujos elementos tem uma relação de ordem. Por exemplo, 5 pode ser um 
conjunto de inteiros. Uma drvore binária de pesquisa para 5 é uma árvore binária própria T 
tal que 


+ N. de T. Em inglês, ir-arder. Em portugués também é conhecido como caminbamente “em-ordem” ou "in-fixadà". 
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e cada nodo interno v de T armazena um elemento de 5 denotado ev); 

* para cada nodo interno v de T, os elementos armazenados na subárvore esquerda de v são 
menores ou iguais а x(v), e os elementos armazenados na subárvore direita de v sejam 
maiores ou iguais a xiv 

sos nodos externos de T não armazenam elementos. 


Um caminhamento interfixado sobre uma árvore binária de pesquisa T visita os elementos 
armazenados em tal árvore, em uma sequência não-decrescente (ver Figura 7.18). 


Figura 7.18 Uma árvore binária de pesquisa que armazena inteiros. O caminho indicado pela 
linha mais espessa corresponde ao caminhamento quando se busca (com sucesso) por 36. O ca- 
minho pontilhado corresponde ao caminhamento quando se busca (sem sucesso) por 70. 


Pode-se usar uma árvore binária de pesquisa T do conjunto 5 para determinar se um certo 
valor y se encontra em 5 percorrendo para baixo a árvore T começando pela raiz (ver Figura 
7.18). Em cada nodo interno v, compara-se o valor pesquisado y com o elemento x(v) armazena- 
do em v. Se y = x(v) então a pesquisa continua na subárvore da esquerda de v. Se y = x(v), então 
a pesquisa terminou com sucesso. Se y = x(v), então a pesquisa continua na subárvore direita. 
Finalmente, se foi encontrado um nodo externo, então a pesquisa terminou sem sucesso, Em 
outras palavras, uma árvore de pesquisa binária pode ser entendida como uma árvore binária de 
decisão (deve-se relembrar do Exemplo 7.8), onde a questão formulada em cada nodo interno diz 
respeito ao fato do elemento armazenado naquele nodo ser menor, igual ou maior que o elemento 
sendo pesquisado. Na verdade, é exatamente esta correspondência com uma árvore de decisão 
binária que motiva a restrição de que árvores de pesquisa binária devem ser próprias (com nodos 
externos “de armazenamento”. 

Observa-se que o tempo de execução de pesquisa em uma árvore binária de pesquisa 7 é 
proporcional à altura de T. Lembrando que a Proposição 7.10 diz que a altura da árvore com n 
nodos pode ser tão pequena quanto login+ 1) ou tão grande quanto (m— 1142, Assim, as árvores 
de pesquisa binária são mais eficientes quando têm altura pequena. Iustra-se um exemplo de 
operação de pesquisa em uma árvore binária de pesquisa na Figura 7.18, e estas árvores serão 
estudadas com mais detalhes na Seção 10.1. 


Usando o caminhamento interfixado para desenhar uma árvore 


O caminhamento interfixado pode também ser aplicado ao problema de computar o desenho de 
uma árvore binária. Pode-se desenhar uma árvore binária T com um algoritmo que atribui coor- 
denadas x e y a um nodo v de T usando as duas regras seguintes (ver a Figura 7.19): 
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* yiv) é igual ao número de nodos visitados antes de v no caminhamento interfixado sobre Т; 

* v(v) é igual à profundidade de v em T. 

Nesta aplicação, assume-se uma convenção comum em computação gráfica, que diz que as 
coordenadas x crescem da esquerda para a direita e as coordenadas v crescem de cima para baixo. 
Portanto, a origem localiza-se no canto superior esquerdo da tela do computador. 


et 

0 | 
| sta E 

I 

| A 

3. i= -+ 
I | 
4 === =|- АД 


| 
012 345 6 7 8 9 10 11 12 


Figura 7.19 Algoritmo de desenho interfixado para uma árvore binária. 


Caminhamento de Euler sobre uma árvore binária 


Os algoritmos de caminhamento em árvores discutidos até agora são formas de iteradores. Cada 
caminhamento visita os nodos de uma árvore em uma ordem determinada e assegura que cada 
nodo seja visitado apenas uma vez. Podem-se unificar os algoritmos de caminhamento forneci- 
dos anteriormente em uma única estrutura; porém, será necessário relaxar o requisito que exige 
que cada nodo seja visitado exatamente uma vez, O método de caminhamento resultante é cha- 
mado de caminhamento de Euler, е será estudado em seguida, A vantagem deste caminhamento 
é que ele permite representar uma variedade de tipos de algoritmos com facilidade, 

O caminhamento de Euler sobre uma árvore binária T pode ser informalmente definido como 
um “passeio” ao redor de T, no qual se inicia pela raiz em direção ao filho da esquerda, e se 
considera as arestas de T como sendo “paredes” que se devem sempre manter à esquerda (ver a 
Figura 7.20). Cada nodo v de Té visitado três vezes pelo caminhamento de Euler: 


= “pela esquerda” (antes do caminhamento sobre a subárvore esquerda de vy; 
e "por baixo” (entre o caminhamento sobre as duas subárvores de v); 
* “pela direita” (depois do caminhamento sobre a subárvore direita de v). 


Se v é externo, então estas tres "visitas", na verdade, ocorrem a0 mesmo tempo. Descreve-se 
o caminhamento de Euler sobre a subárvore enraizada em v no Trecho de código 7.26, 


Figura 7.20 Caminhamento de Euler sobre uma árvore binária. 
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A 


Algoritmo eulerTour Tv): 
executar a ação prevista para o nodo v quando encontrado pela esquerda 
se v tem um filho da esquerda u em T então 
euler Tour Ў.) | percorre recursivamente а subárvore esquerda de 1} 
executa a ação de visita sobre v vindo de baixo 
se v tem um filho da direita w em T então 
eulerTour( Tw} [percorre recursivamente a subárvore direita de v} 
executa à ação prevista para o nodo v pela direita 


Trecho de código 7.26 Caminhamento de Euler de uma árvore binária T com raiz no nodo v. 


Os tempos de execução do caminhamento de Euler são fáceis de analisar, assumindo que a 
visita a cada nodo consome tempo СЬ. Uma vez que se consome um tempo constante em cada 
nodo da árvore durante o percurso, o tempo total de execução é Om). 

O caminhamento prefixado sobre uma árvore binária é equivalente ao caminhamento de Euler 
na medida em que a ação associada a cada nodo ocorre apenas quando o nodo é encontrado pela 
esquerda. Da mesma forma, os caminhamentos interlixados e pós-fixados de uma árvore binária 
são equivalentes a0 caminhamento de Euler na medida em que as ações associadas aos nodos 
ocorrem quando os nodos são encontrados por baixo ou pela direita, respectivamente, O caminha- 
mento de Euler estende os caminhamentos prefixado, interfizado é pós-fixado, mas também pode 
executar outros tipos. Por exemplo, suponha que se deseja calcular o número de descendentes de 
cada nodo v em uma arvore binária com n nodos, Inicia-se o caminhamento de Euler inicializando 
o contador em 0, e então se incrementa o contador cada vez que se visita um nodo pela esquerda, 
Para determinar o número de descendentes de um nodo v, calcula-se a diferença entre o valor do 
contador quando v é visitado pela esquerda e quando é visitado pela direita e soma-se 1. Esta regra 
simples fornece o número de descendentes de v, porque cada nodo na subárvore com raiz em v é 
contada entre a visita a v pela direita e a visita a v pela esquerda, Desta forma, tem-se um método 
que consome tempo Om) para calcular o número de descendentes de cada nodo. 

Outra aplicação do caminhamento de Euler é a impressão de uma expressão aritmética orga- 
nizada entre parênteses a partir de sua árvore (Exemplo 7.9). O algoritmo printExpression, apre- 
sentado no Trecho de código 7.27, atinge este objetivo executando as seguintes ações durante о 
caminhamento de Euler: 

* ação “pela esquerda”: se o nodo é interno, imprimir "(7; 

“ação “por baixo”: imprimir o valor ou operador armazenado no nodo: 
* ação “pela direita”: se o nodo é interno, imprimir "Y". 


Algoritmo printExpressiont T.v): 
se 7 islnternaliv) então 
imprimir "(7 
se 7 hasLeftív! então 
printExpressiond 7,7 efti vH 
se T islnternaliv) então 
imprimir o operador armazenado em v 
Sendo 
imprimir o valor armazenado em v 
se T. hashRight(v) então 
printExpressiont T, T.rightiv 1 
se T islnternal v) então 
imprimir “y” 


Trecho de código 7.27 Um algoritmo para imprimir a expressão aritmética associada com a 
subárvore com raiz no nodo v da árvore T de uma expressão aritmética, 
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7.37 O padrão do método modelo 


Os métodos de caminhamento em árvores descritos até aqui são, na verdade, exemplos de um ра- 
drão de software orientado a objetos, o padrão do método modelo O padrão do método modelo 
descreve um mecanismo de computação genérico que pode ser especializado para uma aplicação 
particular pela redefinição de certos passos. Seguindo o padrão do método modelo, pode-se pro- 
jetar um algoritmo que implementa o caminhamento genérico de Euler sobre uma árvore binária. 
Este algoritmo. chamado de templateEulerTour, é apresentado no Trecho de código 7.28. 


Algoritmo templateE ulerTour Tv): 
F — um objeto novo do tipo TourResult 
visitLefti T. v.r) 
se T.hasLeftiv} então 
r.left = templateEulerTour( 7, T left v1) 
visitBelowt Tur} 
se f.hasRighti v) então 
r.right — templateEuler Tour 7, T .rightiv)) 
visitRightt Tv, 
retorna rout 


Trecho de código 7.28 Caminhamento de Euler sobre uma subárvore com raiz em um nodo v 
de uma árvore binária T, segundo o padrão do método modelo. 


Quando chamado sobre um nodo v, o método templateEuler Tour aciona diferentes métodos 
auxiliares, em diferentes fases do caminhamento, Na verdade ele 


+ спа uma variável local r do tipo TourResult, que é usada para armazenar os resultados 
intermediários da computação e tem os campos left, right e out; 

e chama o método auxiliar visitLeft(F 4,1), que executa os cálculos associados com o encon- 
tro do nodo pela esquerda: 

е se v tem um filho da esquerda, chama a si mesmo recursivamente sobre o filho da esquer- 
da de v e armazena o valor retornado em r.left; 

+ chama o método auxiliar visitBetow(T.v.r), que executa os cálculos associados com o 
encontro do nodo por baixo; 

+ se v tem um filho da direita, chama a si mesmo recursivamente sobre o filho da direita de 
ve armazena o valor retornado em r.right; 

+ chama o método auxiliar visitRight( T.v.r). que executa os cálculos associados com o en- 
contro do nodo pela direita; 

* retorna г.Ош 


O método templateEulerTour pode ser visto como um modelo ou “esqueleto” do caminha- 
mento de Euler. (Wer o Trecho de código 7.28.) 


Implementação Java 


А classe Java EulerTour, apresentada no Trecho de código 7.29, implementa o caminhamento 
de Euler usando o padrão do método modelo. O caminhamento recursivo é executado pelo 
método eulerTour. Os métodos auxiliares chamados por eulerTour são vazios. Isto é, eles têm 
um corpo vazio ou apenas retomam null. À classe EulerTour é abstrata e não pode ser instan- 
ciada. Ela contém um método abstrato chamado execute, que necessita ser especificado em 
uma subclasse concreta de EulerTour. À classe TourResult com os campos left, right e out não 
é apresentada. 


pe 
* Modelo para os algoritmos de caminhamento sobre uma árvore binária usando 
* caminhamento de Euler. Às subclasses desta classe irão refinar alguns dos métodos desta 
* classe para criar um caminhamento especifico. 
*j 
public abstract class EulerTour- E, R> [ 
protected BinaryTree--E-- tree; 
/** Execução do caminhamento. Este método abstrato deve ser especificado em uma 
* subclasse concreta. */ 
public abstract В execute(BinaryTree<E=> T); 
/** Inicialização do caminhamento */ 
protected void init/BinaryTree--E- T) [tree = T; ) 
/** Método modelo */ 
protected A eulerTourfPosition<E> v) I 
TourResult--R7- г = new TourRasult-- В): 
visitLeft(v, г}; 
if (tree.hasLeft(vi) 
r.left = eulerTour(tree left); if caminhamento recursivo 
visitBelowtv, г); 
if (tree.hasRight(v)) 
r.right = eulerTouritree.right(w)): fr caminhamento recursivo 
visitRightiw г); 
return cout; 
} 
// Métodos auxiliares que podem ser redefinidos nas subclasses 
2% Método chamado na visita pela esquerda */ 
protected void visitLeft(Pasition« E - v, TourResult<R=> г) {|} 
/** Método chamado na visita por baixo */ 
protected void visitBelowt(Position-c E> v, TourResult« R-- rj { } 
/** Método chamado na visita pela direita */ 
protected void visitHight(Posibon- E- v, TourResult« R= г} { |] 
) 


Trecho de código 7.29 Classe EulerTour, que define um caminhamento genérico sobre uma 
árvore binária, Esta classe implementa o padrão de método modelo e deve ser especializada de 
maneira a obter um resultado interessante. 


A classe EulerTour propriamente dita nào faz nenhuma computação útil. Entretanto, pode-se 
estender a mesma sobrecarregando os métodos auxiliares para que executem tarefas úteis. Demons- 
tra-se este conceito usando árvores de expressões aritméticas (ver o Exemplo 7.9), Assume-se que 
uma árvore de expressão aritmética tem objetos do tipo ExpressionTerm em cada nodo. À classe Ex- 
pression Term tem as subclasses ExpressionValue (para variáveis) e ExpressionOperator (para opera- 
dores). Por sua vez, a classe ExpressionOperator tem subclasses para os operadores aritméticos, tals 
como AdditionOperator e MultiplicationOperator. O método value de ExpressionTerm é sobrecarre- 
gado por suas subclasses. Para uma variável, ele retorna o valor da variável. Para um operador, ele 
retorna o resultado da aplicação do operador sobre seus operandos. Os operandos de um operador 
são definidos pelo método setOperands de ExpressionOperator. No Trecho de código 7.30, apre- 
senlam-se as classes ExpressianTerm, ExpressionVariable, ExpressionOperator e AdditionOperator. 


r** Classe que representa um termo (operador ou variável) de uma expressão aritmética. */ 
public class ExpressionTerm { 

public Integer getValue( ) { return 0; } 

public String toString( ) | return new String(" "Y. } 
| 
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/** Classe que representa uma variável de uma expressão aritmética. */ 
public class ExpressionVariable extends ExpressionTerm [ 

protected Integer var; 

public ExpressionVariable(Integer x) | var = x; } 

public void setVariable(Integer x) (var = x; ) 

public Integer getvalue( ) { return var; } 

public String toStringi ) | return var.toString h } 


/** Classe que representa um operador de uma expressão antmética. */ 
public class ExpressionOperator extends ExpressionTerm | 
protected Integer firstOperand, secondOperand; 
public void setOperands(Integer x, Integer y) ( 
firstOperand = x; 
secondOperand = y; 
k 
] 
/** Classe que representa o operador de soma de uma expressão aritmética, =/ 
public class 4dditionOperator extends ExpressionOperator [ 
public Integer getvaluel } { 
return (firstOperand + secondOperand); unboxing e então autoboxing 


} 
public String toStringi | { return new Siingi" +"); } 
} 


Trecho de código Т.М! Classes para uma variável, operador genérico e operador de adição de 
uma expressão aritmética. 


Nos Trechos de código 7.3] e 7.32, são apresentadas as classes EvaluateExpressionTour e 
PrintExpressionTour, que especializam EulerTour avaliando e imprimindo a expressão aritmética 
armazenada em uma árvore binária, respectivamente, Á classe EvaluateExpressionTour sobrecar- 
rega o método visitRight( T. vr) com as seguintes compulagbes: 


в se vé um nodo externo, atribua para r.out o mesmo valor de variável armazenado em v; 
+ sendo (vé um nado interno) combine r. left e r.right com o operador armazenado em v Taça 
г.Ош ser igual ao resultado da operação. 


A classe printExpressianTour sobrecarrega os métodos ма eft, visitBalow e visitRight se- 
guindo a abordagem da versão em pseudocódigo apresentada no Trecho de código 7,27, 


/** Calcula o valor de uma árvore de expressão aritmética, */ 
public class EvaluateExpressionTour extends EulerTour< ExpressionTerm, Integer> I 
public Integer exezutelBinar, Tree<ExpressionTerm> T) 1 
іп: ¿chama o método da superclasse 
return eulerTouritree.rootl |): N retorna o valor da expressão 


protected void visitRightíPosition= ExpressionTerm > v, TourResult< Integer-- г} [ 
ExpressionTerm term = w.elernenti(); 
if (tree.ieinternaliv)) { 
ExpressionOperator ор = (Expression Operator terrm: 
op.setÜperandsir.left, right); 
} 
out = term.getWaluet Y; 
} 
) 


Trecho de código 7.34 Classe EvaluateExpressionTour que especializa EulerTour para avaliar a 
expressão associada com uma árvore de expressão aritmética. 
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/** Imprime а expressão armazenada em uma árvore de expressão aritmética. */ 
public class PrintExpressionTour extends EulerTour- ExpressionTerm, String> { 
public String execute(BinaryTree<ExpressionTerm> T) ( 


ШИШ 

System.out.print(" Expression: "|; 
eulerTour(T.rooti 9: 

System.out.println( ); 

return null; // não retoma nada 


| 


protected void visitLeft(Position  ExpressionTerm-- v, TourResult < String-- г} { 
if (tree.igInternal(v)) &ystem.out.print(" ("); } 

protected void visitBalow(Position  ExprassionTerm-- v, TourResult= String r} { 
System.out.print(v.element( }); ) 

protected void visitRight(Position -ExpressionTerm-- v, TourResult « String-- г) [ 
if (tree isinternaliv)) System, out printi") "); } 


) 


Trecho de código 7.32 Classe PrintExpressionTour que especializa EulerTour para imprimir a 
expressão associada com uma árvore de expressão aritmética. 


7.4 Exercícios 


Para obter ajuda e o código fonte dos exercícios, visite java.datastructures.net. 


Reforço 
R-7.1 


R-7.2 
R-7.3 
R-7.4 
R-7.5 


R-7.6 
R-7.7 


R-7.8 


As questões à seguir são relativas à árvore da Figura 7.3. 


E 


. Qual nodo é a raiz? 

. Quais são os nodos internos? 

. Quantos descendentes tem o nodo esQ16/7 

‚ Quantos ancestrais tem o nodo cs016/? 

Quais são os irmãos do nodo tamas? 

Que nodos pertencem à subárvore com raiz no nodo projetos/? 
. Qual é a profundidade do nodo trabalhos? 

. Qual a altura da árvore? 


ng 


>=. a 


Ег 


Encontre o valor da expressão aritmética associada com cada subárvore da 
árvore binária da Figura 7.11. 


Seja T uma árvore binária com т nodos que pode ser imprópria, Descreva 
como representar T como uma árvore binária própria T" com O(n) nodos. 
Quais são os números mínimo e máximo de nodos internos e externos em 
uma árvore binária imprópria com n nodos? 

Mostre uma árvore que resulta no pior casó para © tempo de execução do 
algoritmo depth. 

Apresente uma justificativa para a Proposição 7.4, 

Qual é o tempo de execução do algoritmo height2(T, v) (Trecho de código 
7.6) quando ativado sobre um nodo v que não a raiz de T7 

Seja T a árvore da Figura 7.3 e referindo-se aos Trechos de código 7.9 e 7,10, 
a. forneça a saída do algoritmo toStringPostorder( T, T.root( j): 

b. forneca a saída do algoritmo parentheticRepresentationi T, T,roott )). 
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R-7.9 


R-7.10 


Е-7.11 


R-7.12 


R-7.13 


R-7.14 


R-7.15 


R-7.16 


R-7.17 


R-7.18 


R-7.19 


Descreva as modificações no método parentheticRepresentation, apresen- 
tado no Trecho de código 7.10, de maneira que o mesmo use o método 
length( ) dos objetos String para exibir a representação entre parênteses de 
uma árvore, com à adição de quebras de linha e de espaços para exibir a 
ärvore em uma janela de texto com 80 caracteres de largura. 

Desenhe uma árvore que represente uma expressão com quatro nodos ex- 
ternos armazenando os números 1, 5, бе 7 (com cada número armazenado 
em um nodo externo, ainda que não necessariamente nesta ordem) e trés 
nodos internos = cada um armazenando uma operação do conjunto (+, 
=, X, /] de operadores aritméticos, de maneira que o valor da raiz seja 21. 
Os operadores podem retornar e agir sobre frações e um operador pode ser 
usado mais de uma ver. 


Seja T uma árvore ordenada com mais de um nodo, E possível que o ca- 
minhamento prefixado de T visite os nodos na mesma ordem que o cami- 
nhamento pós-fixado de 77 Em caso afirmativo, forneça um exemplo, caso 
contrário, argumente por que 1550 não pode ocorrer. Da mesma forma, č 
possivel que o caminhamento prefixado de T visite os nodos na ordem in- 
versa do caminhamento pós-fixado? Em caso afirmativo, forneca um exem- 
plo; caso contrário, argumente por que isso não pode ocorrer. 

Responda a questão anterior para o caso de T ser uma drvore binária própria 
com mais de um nodo, 

Qual € o tempo de execução de parentheticRepresentartiont T, T.root( )) 
(Trecho de código 7.10) para uma árvore com a nodos? 

Desenhe uma (única) árvore binária tal que: 

= cada nodo interno de T armazene um único caracter; 

e ocaminhamento prefixado de T produza EXAMFUN; 

* ocaminhamento interfivado de T produza MAFXUEN, 

Responda as seguintes questões de maneira a justificar a Proposição 7.10. 


a. Qual € o número minimo de nodos externos de uma árvore binária pró- 
pria com altura ^? Justifique sua resposta. 
b. Qual € o número máximo de nodos externos de uma árvore binária pró- 
pria com altura A? Justifique sua resposta. 
с. Seja T uma árvore binária com altura Л e т nodos, mostre que 
login + 1 — 1 £ hz ín - DA. 


d. Para quais valores de n e й acima, os limites superior e inferior de À po- 
dem ser atendidos com equilibrio? 

Descreva uma generalização do caminhamento de Euler para árvores de ma- 

neira que cada nodo interno tenha três filhos, Descreva como você pode usar 

este caminhamento para computar à largura de cada nodo desta árvore. 

Compute a saída do algoritmo toStringPostorder(T T.root( J), а partir do 

Trecho de código 7.12 sobre a árvore T da Figura 7.3. 

Desenhe à execução do algoritmo diskSpace T, T.root( jj (Trecho de código 

7.13) sobre a árvore T da Figura 7.9, 

Seja Ta árvore binária da Figura 7.11 

à. Apresente a saída de toStringPostorder( T, Гос } (Trecho de código 7.9. 

b. Apresente à saída de parentheticRepresentationi 7. 7.госц j) (Trecho de 
código 7.10. 


R-7.20 


R-7.2] 


R-7.22 


R-7.23 


Criatividade 
C-7.1 


C-7.2 


C-7.3 


C-7.4 
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ed 


Seja Ta árvore binária da Figura 7.11. 

à. Apresente а saída do algoritmo toStringPostorder( T. T.root( )) (Trecho de 
código 7.12). 

b. Apresente a saída do algoritmo printExpressiont 7, 7.root( j) (Trecho de 
código 7.27). 

Descreva um algoritmo em pseudocódigo para computar a quantidade de 

descendentes de cada nodo de uma árvore binária. O algoritmo deve ser 

baseado no caminhamento de Euler. 

Seja T uma árvore binária (possivelmente imprópria) com n nodos e que 

denote por D a soma das profundidades de todos os nodos externos de T. 

Mostre que se T tem o número mínimo de nodos externos possíveis, então 

Dé On). e que se 7 tem número máximo de nodos externos possível, então 

D é Oin log n). 


Seja T uma árvore binária com n nodos e seja p a numeração dos niveis de 

T, como visto na Seção 7.3.3, 

a. mostre que, para todo nodo v de T, pi) = 2 — 1: 

b. mostre um exemplo de árvore binária com sete nodos que atinjam o limi- 
te superior acima no valor máximo de piv) para algum nodo v. 

Mostre como usar o caminhamento de Euler para computar à numeração 

dos níveis definida na Seção 7.3.5 de cada nodo de uma árvore binária T. 

Desenhe uma árvore binária que represente a seguinte expressão aritmética: 

"(((5 + 2)«(2— 194 (02 +9) + {7 — 2) —– 1)) B". 

Seja T uma árvore binária com a nodos que é implementada sobre uma lista 

arranjo, 5, e seja p a numeração dos níveis de T como mostrado na Seção 

7.3.5, apresente descrições em pseudocódigo para os métodos root, parent, 

left, right, hasLeft, hasRight, isInternal, isExternal e isRoot, 


Para cada nodo v de uma árvore T, pre(v) é a colocação de v em um caminha- 

mento prefixado sobre T; роза) é a colocação de v em um caminhamento 

pós-fixada sobre T; depthiv) é a profundidade de v: e desc(v) é o número 

de descendentes de v sem contar o próprio v. Derive a fórmula que define 

postivi em termos de desc(v). depth(v) e prenv) para cada nodo v de T. 

Seja T uma árvore cujos nodos armazenam strings. Forneça um algoritmo 

eficiente que calcule e imprima, para todo o nodo v de T, a string armazena- 

da em v e a altura da subárvore com raiz em v. 

Projete algoritmos para as seguintes operações de uma árvore binária T: 

e preorderNextiv): retorna o nodo visitado depois do nodo v em um cami- 
nhamento prefizado sobre T. 

* inorderNextiv): retorna o nodo visitado depois do nodo v em um cami- 
nhamento interfixado sobre T. 

+ postorderNext(v): retorna o nodo visitado depois do nodo v em um ca- 
minhamento pós-fixado sobre Т. 

Quais são os tempos de execução para o pior caso dos seus algoritmos? 

Apresente um algoritmo (a) para calcular a profundidade de todos os no- 

dos de uma árvore 7, onde m é o número de nodos de T. 
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C-7.5 


Figura 7.21 


C-7.h 


C-7.] 


C-7.8 


C- 7 


C-7.10 


C-7.11 


A representação indentada entre parênteses de uma árvore Té uma variação 
da representação entre parênteses de T (ver a Figura 7.7), que usa indenta- 
ção e quebras de linha como demonstrado na Figura 7.21. Apresente um 
algoritmo que imprime esta representação de uma árvore. 


Vendas | 
Nacional 
Internacional 4 
Canada 
América do Sul 
Ultramar ( 
África 
Europa 
Asia 
América Australia 
do Sul | 
i 
: і 
(а) (b) 


(a) Árvore T; (b) representação indentada entre parênteses de T. 


Seja 7 uma árvore binária (possivelmente imprópria) com n nodos, е seja О 

a soma das profundidades de todos os nodos externos de 7. Descreva uma 

configuração para T onde D seja (Mar). Esta árvore deve corresponder ao 

pior caso para o tempo de execução assintótico do algoritmo height1 (Tre- 

cho de código 7.5). 

Para uma árvore T, considere que n, denota a quantidade de nodos internos 

en, denota a quantidade de nodos externos. Mostre que, se todo nodo inter- 

no de Tem exatamente trés filhos, então л = Im + 1. 

Descreva como clonar uma árvore binária própria usando o método attach 

em vez dos métodos insertLeft e insertRight. 

O fator de balanceamento de um nodo interno + de uma árvore binária 

própria é a diferença entre as alturas das subárvores direita e esquerda de 

v. Mostre como especializar o caminhamento de Euler da Seção 7.3.7 para 

imprimir os fatores de balanceamento de todos os nodos de uma árvore 

binária própria. 

Duas árvores ordenadas T" e T" são ditas isomórficas se uma das seguintes 

condições se aplicar: 

= lanto É como 7" são vazias; 

e tanto 7 como T" consistem em apenas um nodo; 

= tanto 7 como 7" tém o mesmo número k = | de subárvores, e a i-ésima 
subärvore de Té isomórfica à i-ésima subárvore de 7" para = 1,..., K. 

Projete um algoritmo que testa quando duas árvores ordenadas são isomár- 

ficas. Qual o tempo de execução de seu algoritmo? 

Estenda à conceito do caminhamento de Euler para uma árvore ordenada 

que não seja necessariamente binária. 
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Pode-se definir a representação de uma drvore binária T de uma árvore 

genérica T como segue (Figura 7.2.2): 

+ Para cada nodo u de T, existe um nodo ш" de T associado com n. 

* Seu é um nodo externo de T, e não existe um irmão que o segue, então 
os filhos de u' em T" são nodos externos. 

e Seu é um nodo interno de T, e v € o primeiro filho de н em T, então v' é 
о filho da esquerda de u' em Г. 

e Sconodo v tem um irmão w que o segue, então м" é o filho da direita de 
v'em Т". 

Fornecida tal representação 7” de uma árvore ordenada genérica T, respon- 

da cada uma das questões que seguem: 

a. O caminhamento prefixado sobre T' é equivalente ao caminhamento pre- 
fixado sobre T? 

b. O caminhamento pós-fixado sobre 7" é equivalente ao caminhamento 
pós-fixado sobre Т? 

с. O caminhamento interfixado de 7° é equivalente a algum dos caminha- 
mentos padrão sobre T? Em caso positivo, qual deles? 


(b) 


Figura 7.22 Representação de uma árvore binária: (a) árvore T; (b) árvore binária T' correspon- 
dente a T. As arestas tracejadas coneciam nodos de T' que correspondem a irmãos em T. 


C-7.13 


C-7.14 


Como foi mencionado no Exercício 5.8, à notação pós-fixada é uma forma 
náio-ambigua de escrever expressões aritméticas sem usar parênteses. Se 
for definido que “(exp реду," é uma expressão entre parênteses normal 
(interfixada) com operador op. então o pós-lixado equivalente é "pex, 
pexp, op". onde pexp, é a versão pós-fixada de exp, e pexp, ё a versão 
pós-hxada de exp, A versão pós-Dixada de um único número ou variável 
ёо próprio número ou variável, Assim, por exemplo, a versão pós-lixada 
da expressão interfixada "((5 + 2) + (8 — 3/4" ¿*52+83- ed?” 
Forneça um algoritmo eficiente para converter uma expressão interfixada 
em sua equivalente em notação pós-fixada. (Dica: primeiro converta a ex- 
pressão interfixada em sua árvore binária equivalente, usando o algoritmo 
do Trecho de código 7.21). 


Sendo dada uma árvore binária própria T, defina o reflexo de T como sendo 
uma árvore binária 7" tal que cada nodo v de T esteja também em 7”, mas de 
maneira que o filho da esquerda de v em T seja o filho da direita de v em T" 
e o filho da direita de v em T seja o filho da esquerda de v em 7. Mostre que 
um caminhamento prefixado sobre uma árvore binária Té o mesmo que o 
caminhamento pös-fixado sobre o reflexo de T mas па ordem inversa. 
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C-7.15 


C-7.16 


C-7.17 


C-7.18 


C-7.20 


C-7.22 


C-7.23 


O algoritmo preorderDraw desenha uma árvore binária T atribuindo coor- 
denadas x e v para cada nodo v, de maneira que xir) é igual ao número de 
nodos que precede v no caminhamento prefixado de T, € vir) é igual à pro- 
fundidade de v em T. O algoritmo postOrderDraw é similar a preorderDraw, 
mas atribui as coordenadas x usando um caminhamento pós-fixado. 


a. Mostre que o desenho de T produzido pelo algoritmo preorderDraw não 
аргехе nta arestas quie e Спит, 
b. Redesenhe a árvore binária da Figura 7.19, usando o algoritmo preorder- 
Draw. 
c. Mostre que o desenho de T produzido pelo algoritmo postorderDraw não 
apresenta arestas que se cruzer. 
d. Redesenhe a árvore binária da Figura 7.19, usando o algoritmo postor- 
derDraw. 
Prajete um algoritmo para desenhar árvores genéricas que generaliza a abor- 
dagem do caminhamento interfixado para o desenho de árvores binárias. 
Considere que a ação a ser aplicada durante o caminhamento de Euler seja 
denotada pelo par (v.g), onde y é o nodo visitado e a é da esquerda, abai- 
xo ou da direita. Projete e analise um algoritmo que execute à operação 
іригМехі va) que retorna a ação (wb) que segue (va). 
Considere uma variação da estrutura de dados encadeada para árvores biná- 
nas na qual cada objeto nodo tem referências para os objetos nodo filhos, 
mas não para o objeto nodo pai. Descreva a implementação dos métodos de 
uma árvore binária com esta estrutura e analise a complexidade temporal 
destes métodos. 
Projete uma implementação alternativa para a estrutura de dados encadeada 
para árvores binárias usando uma classe para os nodos que seja especializa- 
da em subclasses para nodo interno, nodo externo e raiz. 
Usando uma estrutura de dados encadeada para árvores binárias, explo- 
re um projeto alternativo para implementar os iteradores retornados pelos 
métodos iterator( |, positionsí ).iteratar( ) e childrentw).iteratorí | de maneira 
que cada um desses métodos execute em tempo CK I]. É possível obter ım- 
plementações de tempo constante para os métodos de iteração hasMext( ) e 
next() dos iteradores retornados? 
Seja T uma árvore com n nodos, Defina o ancestral comum mais baixo 
(ACB) entre dois nodos v e w como o nodo mais baixo de T que tem am- 
bos, v € w como descendentes (neste caso permitimos que um nodo seja 
descendente de si mesmo). Dados dois nodos ve w, descreva um algoritmo 
eficiente para encontrar o ACB de v e w. Qual é o tempo de execução do 
algoritmo? 
Seja T uma árvore com n nodos e para cada nodo v de T denotamos d, a 
profundidade de v em T. A distância entre dois nodos v e wem Ted, + d, 
— 2d, onde u ¿o ACB u de v € w (como definido no exercicio anterior). O 
diámetro de T é a distância máxima entre dois nodos em 7. Descreva um 
algoritmo eficiente para encontrar o diâmetro de T. Qual o tempo de execu- 
ção de seu algoritmo? 
Suponha que cada nodo v de uma árvore binária T seja rotulado com seu wa- 
lor piv? em um dos níveis numerados de T. Projete um método rápido para 
determinar ple) para o ancestral comum mais baixo (ACB), u, entre dois 
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QA me mn 


C-7.24 


C-7.26 


С.Т 


C-7.28 


C-7.29 


C-7.30 


Projetos 
P-7.1 
P-7.2 
P-7.3 
Р-7.4 
Р.7.5 


nodos ve w de T, dados p(v)e mw). Não é necessário determinar u, apenas 
calcular o nümero que identifica seu nivel. 


Justifique os limites da Tabela 7.3 com ums análise detalhada dos tempos 
de execução dos métodos de uma árvore binária 7, implementada sobre 
uma lista arranjo 5, onde 5 é definida sobre um arranja. 

Justifique a Tabela 7.1 resumindo o tempo de execução dos métodos de 
uma árvore representada com uma estrutura encadeada apresentando, para 
cada método, uma descrição de sua implementação e uma análise do tempo 
de execução. 

Descreva um método näo-recursivo para avaliar uma árvore binária que re- 
presenta uma expressão aritmética. 

Seja T uma árvore binária com a nodos, defina um nodo romano como sen- 
do um nodo v de 7, de maneira que o número de descendentes na subárvore 
esquerda de v diferencie-se do número de descendentes da subárvore direita 
de v por no máximo 5. Descreva um método com tempo de execução linear 
para encontrar cada nodo v de T, tal que v não seja um nodo romano, mas 
que todos os seus descendentes o sejam. 


Descreva um método näo-recursivo para executar o caminhamento de Eu- 
ler sobre uma árvore binária que execute em tempo linear e nào use uma 
pilha. 

Descreva em pseudocódigo um método não-recursivo para executar o cami- 
nhamento interfixado sobre uma árvore binária em tempo linear. 

Seja T uma árvore binária com n nodos (T pode ser implementada usando 
uma lista arranjo ou uma estrutura encadeada). Forneça um método de 
tempo linear que use métodos da interface BinaryTree para percorrer os 
nodos de T através do incremento dos valores da função de numeração por 
nivel p apresentada na Seção 7.3.5. Esse caminhamento é conhecido como 
caminhamento por nível. 


O tamanho do cominho de uma árvore T é a soma das profundidades de 
todos os nodos de T. Descreva um método com tempo de execução linear 
para calcular o tamanho do caminho de uma árvore T (que não é necessaria- 
mente binária) 


Defina o tamanho do cominho interno, KT}, de uma árvore T como sendo a 
soma das profundidades de todos os nodos internos de 7. Da mesma forma, 
defina o tamanho do caminho externo, ECT), de uma árvore T como sendo 
a soma das profundidades de todos os nodos externos de T. Mostre que se 7 
é uma árvore binária com a nodos internos, então ЕСГ) = NT) +n— 1. 


implemente o TAD árvore binária usando uma lista arranjo. 

Implemente o TAD árvore binária usando uma lista encadeada. 

Escreva um programa capaz de desenhar uma árvore binária, 

Escreva um programa capaz de desenhar uma árvore genérica. 

Escreva um programa que permita tanto entrar como exibir a árvore genea- 
lógica de alguém. 


288 Estruturas de Dados e Algoritmos em Java 


Po th 
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P-7.8 


Implemente o TAD árvore usando a representação por árvores binárias des- 
crita no Exercício C-7.12. Você pode reusar a implementação de LinkedBi- 
naryTree para árvores binárias. 

Uma planta baixa fatiada é a decomposição de um retângulo com lados 
horizontais e verticais usando cortes horizontais e verticais. (Veja a Figu- 
га 7.234.) Uma planta baixa fatiada pode ser representada por uma árvore 
binária chamada de drvore de fatias, cujos nodos internos representam os 
cortes e os nodos externos representam os retângulos hásicos em que o chão 
é dividido pelos cortes. (Veja a Figura 7.23b.) O problema da compactação 
é definido como segue. Pressuponha que para cada retângulo básico de uma 
planta baixa fatiada atribui-se uma largura mínima we uma altura minima A. 
O problema da compactação é encontrar a menor largura е altura para cada 
retângulo da planta baixa que seja compativel com as dimensões mínimas de 
cada retângulo básico. Em outras palavras, este problema requer a atribuição 
de valores hir} e wer) para cada nodo v da árvore de fatias de maneira que: 


se v for um nodo externo cujo 
LI retângulo base tem a largura mínima m 
se v for um nodo interno associado 
wiis max(w(w), w(z)) com um corte horizontal com o filho 
da esquerda w e da direita z 
se v for um nodo interno associado 
ww) + wiz) com um corte vertical com o filho da 
esquerda w e da direita z 


se v For um nodo externo cujo 
h retângulo base tem a altura mínima її 
se v for um nodo interno associado 
hi) = hiw + hizi com um corte horizontal com o filho 
da esquerda w e da direita z 
se v for um nodo interno associado 
тах {hw hi zi} com um cone vertical com o filho da 
esquerda w e da direita z 


Projete uma estrutura de dados para plantas baixas fatiadas que suporte as 
operações: 

e crar uma planta Каха composta de retânguios básicos individuais; 
decompor um retângulo hásico através de um corte horizontal; 
decompor um retângulo básico através de um corte vertical; 

atribuir uma altura e largura minima a um retângulo básico; 

desenhar a árvore de fatias associada à planta barxa; 


compactar e desenhar a planta baixa. 

Escreva um programa que efetivamente possa jogar o jogo-da-velha (ver 
Seção 3.1.5). Para tanto, será necessário criar uma drvore de jogadas T, 
que é uma árvore na qual cada nodo representa uma configuração de 
Jogada, o que, neste caso, corresponde a uma representação do tabuleiro 
do jogo-da-velha. O nodo raiz corresponde à configuração inicial. Para 
cada nodo memo v de T, os filhos de v correspondem aos estados do jogo 
possíveis de serem alcançados a partir do estado inicial em uma única 


—[orn 


Figura 7.23 


P-7.9 


P-7.10 


P-7.11 
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(a) 


(a) Planta baixa fatiada: (b) árvore de fatias associada com a planta baixa. 


jogada do jogador da vez, A (o primeiro jogador) ou É (o segundo joga- 
dor). Nodos de profundidade par correspondem a jogadas de A e nodos 
de profundidade impar correspondem a jogadas de B. Nodos externos po- 
dem ser tanto estados finais do jogo ou estarem localizados em uma pro- 
fundidade que não se deseja explorar. Para cada nodo externo atribui-se 
um valor que indica quio bom este estado é para o jogador A. Em jogos 
mais complexos, como o xadrez, é necessário adotar uma função heuris- 
пса para atribuir este valor, mas para jogos simples, como jogo-da-velha, 
pode-se construir toda а árvore de jogadas e atribuir valor para os nodos 
com +1,0, —1, indicando se à jogador A tem a ganhar ou a perder com 
está configuração. Um bom algoritmo de seleção de jogadas é o minima. 
Neste algoritmo, atribui-se um valor para cada nodo interno v de 7, de ma- 
neira que se v representa a vez de A, calcula-se o valor de v como o valor 
máximo dos filhos de v (que corresponde a melhor jogada para A a partir 
de v). Se um nodo interno v representa a vez de H, então calcula-se o va- 
lor de v como o menor valor dos filhos de v (o que corresponde a melhor 
Jogada para B a partir de v). 

Escreva um programa que receba como entrada uma expressão aritmética 
toda entre parênteses e a converta em uma árvore binária que representa 
uma expressão. Seu programa deve exibir a árvore de alguma forma e tam- 
bém imprimir o valor associado com a raiz. Como desafio adicional, permi- 
ta que se armazene nas lolhas variáveis da forma x, кы. x, €, assim por dian- 
te que são inicializadas com O e que podem ser atualizadas interativamente 
por meio do programa, atualizando de forma coerente o valor impresso que 
corresponde ao valor da raiz da árvore que representa a expressão, 

Escreva um programa que visualiza o caminhamento de Euler sobre uma 
árvore binária própria, incluindo os movimentos nodo a nodo e as ações 
associadas com as visitas pela esquerda, por baixo e pela direita. Demons- 
tre seu programa fazendo-o computar e mostrar os rótulos prefixados, in- 
terfixados e pós-fixados, bem como contadores de ancestrais e contadores 
de descendentes para cada nodo da árvore (não necessariamente todos ao 
mesmo tempo. 

A codificação de expressões aritmética apresentada nos Trechos de código 
7.29-7.32 funciona apenas para expressões inteiras com operador de soma. 
Escreva um programa Java que possa calcular expressões arbitrárias com 
qualquer tipo numérico de objeto, 
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Observações sobre o capítulo 


Discussões sobre os caminhamentos clássicos, prefixado, interfixado e pós-fixado podem ser 
encontradas no livro do Knut, Fundamental Algorithms [62]. O caminhamento de Euler é ori- 
ginário da comunidade de processamento paralelo, e foi introduzido por Tarjan e Vishkin [89] е 
discutido por Jälá [53] e por Karp e Ramachandran [57]. O algoritmo de desenho de uma árvore 
é genericamente considerado como parte do “folclore” dos algoritmos de desenho de grafos, Para 
o leitor interessado no desenho de grafos, indicam -se os trabalhos de Tamassia [88] e Di Battista 
et al.[30]. O quebra-cabeça do Exercício R-7.10 foi apresentado por Micha Sharir. 
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8.1 


O tipo abstrato de dados fila de prioridade 


Uma fila de prioridade é um tipo abstrato de dados para armazenar uma coleção de elementos 
priorizados que suporta a inserção de elementos arbitrários, mas suporta a remoção de elemen- 
tos em ordem de prioridade, ou seja, o elemento com prioridade mais alta pode ser removido a 
qualquer momento. Este TAD é fundamentalmente diferente das estruturas de dados posicionais 
discutidas nos capitulos anteriores, tais como pilhas, filas, degues, sequências e mesmo árvores. 
Essas estruturas de dados armazenam elementos em posições especificas, que são freqüenternen- 
te posições em uma estrutura linear de elementos, determinada pela sequência efetuada de inser- 
ções e remoções. O TAD fila de prioridade armazena elementos de acordo com suas prioridades, 
e nào tem noção de “posição. 


8.1.1 


Chaves, prioridades e relações de ordem total 


As aplicações comumente requerem a comparação e classificação de objetos de acordo com pa- 
rámetros ou propriedades, chamadas “chaves”, que são associadas a cada objeto em uma coleção. 
Formalmente, uma chave é definida como um objeto associado a um elemento como seu atributo 
específico, e que pode ser usada para identificar, classificar ou ponderar esse elemento. E impor- 
tante observar que a chave é associada a um elemento, tipicamente por um usuário ou aplicação, 
e por isso pode representar uma propriedade que um objeto não possui originalmente. 

No entanto, a chave que uma aplicação associa a um objeto não é necessariamente única, 
e uma aplicação pode alterar a chave de um elemento se for necessário. Por exemplo, podemos 
comparar companhias por seus lucros ou pelo número de funcionários. Portanto, qualquer um 
desses parâmetros pode ser usado como chave para uma companhia, dependendo da informação 
que se deseja buscar. De forma similar, pode-se comparar restaurantes pela qualificação dada por 
um gastrónomo ou pelo preço médio da refeição. Para obter maior generalidade, portanto, pode- 
se permitir que uma chave seja do tipo mais adequado а uma aplicação. 

Como no exemplo anterior sobre o aeroporto, a chave usada para comparações é freqilen- 
temente mais do que um simples valor numérico como preço, tamanho, peso ou velocidade. Ou 
seja, uma chave pode ser uma propriedade mais complexa que não pode ser quantificada com um 
simples número. Por exemplo, a priondade de passageiros em espera é geralmente determinada 
levando-se em conta vários fatores diferentes, como condição de viajante frequente, tarifa paga 
e hora de chegada. Em algumas aplicações, a chave para um objeto é parte do próprio objeto 
(por exemplo, pode ser o preço de um livro ou o peso de um automóvel). Em outras aplicações, 
a chave não faz parte do objeto, mas é associada a ele pela aplicação (por exemplo, o grau de 
retomo de uma ação dada por um analista de finanças, ou a prioridade dada a um passageiro pelo 
atendente de embarque). 


Comparando chaves com ordens totais 


Uma fila de prioridade precisa de uma regra de comparação que nunca se contradiga. Para que 
uma regra de comparação (denotada =) seja robusta, ela deve definir uma relação de ordem 
total, o que significa dizer que a regra de comparação é definida para cada par de chaves e deve 
satisfazer as seguintes propriedades: 


«+ Propriedade reflexiva: k = x. 
+ Propriedade anti-simétrica: se £, = k e k, € ko entiok, = ky 
+ Propriedade transitiva: se k, = k ck, = k entàa Ё = k, 


(qualquer regra de comparação = que satisfaça essas trés propriedades nunca levará a uma 
contradição nas comparações. De fato, uma regra assim define uma relação de ordem linear sobre 
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um conjunto de chaves; assim, se uma coleção (finita) de elementos tem uma ordem total defini- 
da para si, então a noção de uma menor chave E... € bem definida, como uma chave рага à qual 
ka 5 k para qualquer outra chave & na coleção. 

Uma fila de prioridade é um contêiner de elementos, cada um tendo uma chave associada 
atribuída no instante em que o elemento é inserido. O nome “fila de prioridade” vem do fato de 
que as chaves fornecem a “prioridade” usada para escolher elementos a serem removidos. Os 
dois métodos fundamentais de uma fila de prioridade P são: 


ж insertltem(ke): insere o elemento е com chave k em Р; 
+ removeMin(): retorna e remove de P o elemento com a menor chave, ou seja, um elemento 
cuja chave é menor ou igual à chave de qualquer outro elemento em P. 


Às vezes, as pessoas se referem ao método remaveMin como ú método “extractMin”, para 
enfatizar que este método simultaneamente remove e retorna o elemento com à menor chave em 
Р. Há muitas aplicações em que as operações de insertitem e removeMin desempenham um papel 
importante. Uma aplicação assim é analisada no exemplo que se segue. 


Exemplo 8.1 Suponha que um vão está totalmente reservado uma hora antes da decolagem. 
Por causa da possibilidade de cancelamentos, à companhia aérea mantém uma fila de priori- 
dade de passageiros em espera por um assento. À prioridade de cada passageiro é determinada 
pela companhia levando em conta a tarifa paga, a condição (ou não) de cliente freqüente do 
passageiro e desde quando o passageiro está à espera do lugar. Uma referência para o passager 
ro em espera é inserida na fila de prioridade com uma operação de insertltem. Pouco antes da 
saida do удо, se houver lugares disponíveis (por exemplo, devido a ausências on cancelamentos ) 
a companhia remove da fila de prioridade o passageiro em espera com maior prioridade usando 
uma operação remaveMin, e dd um lugar a ele. O processo é repetido até que todos os lugares 
livres tenham sido tomados ou que a fila de prioridade esteja vazia. 


8.1.2 Entradas e comparadores 
Existem dois tópicos importantes indeterminados até este ponto: 


+ Como mantêm-se o rastro de associações entre chaves e valores? 
+ Como comparam-se chaves e como determina-se a menor chave? 


Responder estas questões envolve o uso de dois interessantes padrões de projeto, 

A definição da fila de prioridade cria implicitamente o uso de dois tipos especials de objetos 
que respondem as questões anteriores, entrada (entry) e comparador (comparator), os quais 
serão discutidos nesta subsegän, 


Entradas 


Uma entrada é uma associação entre uma chave £ e um valor x, isto é, uma entrada é simples- 
mente o par chave-valor. Usam-se entradas na fila de prioridade О para se ter noção de como Q 
associa chaves com seus respectivos valores. 

Uma entrada é realmente um exemplo mais abrangente de um padrão de projeto orientado a 
objetos, o padrão composição, o qual define um simples objeto que é composto de outros obje- 
tos. Usa-se este padrão na fila de prioridade quando definem-se as entradas sendo armazenadas 
na lista de prioridade, consistindo o par da chave É a no valor x. 

Lim par é a composição mais simples, para combinar dois objetos em um simples objeto (o par). 
Para implementar este conceito, define-se uma classe que armazena dois objetos na primeira e na se- 
gunda variável de instância, respectivamente, e provê métodos para acessar e alterar estas variáveis. 
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O Trecho de código 8.1, mostra uma implementação de entradas no padrão composição, ar- 
mazenando pares chave-valor uma fila de prioridade. Implementa-se esta composição como uma 
interface chamada Entry (o pacote java.util inclui uma interface Entry similar). Outros tipos de 
composições incluem triplos, os quais armazenam três objetos, quádruplos, os quais armazenam 
quatro objetos, e assim por diante, 


Pe interface para Entrada do par chave-valor **/ 
public interface Entry <K,V> ( 
/** Retorna uma chave armazenada nesta entrada. */ 
public К getkeyf ); 
/** Retorna o valor armazenado nesta entrada. */ 
public V getValue( |; 


Trecho de código 8.1 Interface Java para uma entrada que armazena o par chave-valor em uma 
fila de prioridade 


Comparadores 


Outro importante tópico no TAD fila de prioridade que é preciso definir é como especificar a 
relação a ser usada para comparar chaves. Existem algumas escolhas com respeito a este tópico 
que podem ser feitas neste ponto. 

Uma possibilidade, que & a mais concreta, é implementar uma fila de prioridade diferente 
para cada tipo de chave que se deseja usar e para cada forma possível de comparar tais chaves. 
O problema com esta abordagem é que ela não é genérica, e requer que sejam criados muitos 
códigos similares. 

Uma estratégia alternativa seria exigir que as chaves pudessem comparar a si mesmas. 
Essa solução permite a cração de uma classe de fila de prioridade genérica que armazena 
instâncias de uma classe de chaves que implementa algum tipo de interface Comparable e 
encapsula todos os métodos de comparação. Essa solução é um avanço sobre a abordagem 
especializada, pois ela permite que se escreva uma única classe para a fila de prioridade que 
pode tratar vários tipos diferentes de chave. Mesmo assim, existem contextos em que esta so- 
lução não é possível, pois muitas vezes as chaves não “sabem” como devem ser comparadas. 
A seguir, dois exemplos. 


Exemplo 8.2 Dadas as chaves 4 e 11, tem-se 4 = 11 se as chaves forem objetos inteiros (a ser 
comparados da forma usual) mas 11 = 4 se as chaves forem cadeias de caracteres (a ser com- 
paradas lexicograficamente). 


Exemplo 8.3 Um algoritmo geométrico pode comparar os pontos p e q no plano por suas co- 
ordenadas x (ou кеўи, p = q se xp) = xig e ordend-los da esquerda para a direita, enquanto 
outro algoritmo pode compará-los pela coordenada y (ou seja p = q se vip) = vlg) e ordená-los 
de baixo para cima. Em princípio, ndo há nada no conceito de "ponto" que informe se os pontos 
devem ser comparados por coordenada x ou y. Muitas outras maneiras de comparar pontos po- 
dem ser definidas (por exemplo. comparar pela distância de p e q até a origem) 


Assim, para obter a forma mais genérica e reutilizável de fila de prioridade, não se deve es- 
perar que as chaves forneçam seu próprio mecanismo de comparação, Em vez disso, usam-se ob- 
jetos comparadores especiais, que são extemos às chaves e fornecem as regras de comparação. 
Um comparador é um objeto que compara duas chaves. Pressupõe-se que uma fila de prioridade 
P recebe um comparador quando é construída, e pode-se imaginar que uma fila de priondade 
receba outro comparador se o antigo ficar “desatualizado”. Quando P precisa comparar duas 
chaves, ela usa o comparador para fazer as comparações. Assim, um programador pode escrever 
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uma implementação genérica para uma fila de prioridade que funcione corretamente em uma 
variedade de contextos, 

Formalmente, o TAD comparador provê um eficiente mecanismo de comparação, baseado 
em um simples método que recebe duas chaves e comparando-as (ou relatando um erro se as 
chaves são incompatíveis): 


compare(g.5r Retoma um valor inteiro ¿onde < О sea < h,i = Пебп = рес 0 
se a > b; um erro ocorre se a e b não podem ser comparados. 


A interface padrão Java java. util Comparator corresponde ao TAD comparador descrito aci- 
ma, o qual oferece uma forma geral, dinâmica e reutilizável de comparar objetos. Esto também 
inclui um método equals() para comparar um objeto comparator com outro objeto comparator. O 
Trecho de código 8.2 apresenta um exemplo de um comparador, para pontos em 2D (Trecho de 
código 8.3), o qual é um exemplo do padrão composição. 


r** Comparador para pontos 2D sobre o padrão de ordem lexicográfico. +, 
public class Lexicographic<E extends Point?D> 
implements java.util.Comparator--E-- 1 
/** Compare two points */ 
public int compare(E a, E b) { 
if (а getX() != b.getX()) 
return b.getXir) = a.getX[ |; 
else 
return b.getY() — аде; 


| 
| // Classe Lexicographic automaticamente herda o método equals() method da classe Object 


Trecho de código 8.2 Um comparador рага pontos 2D bascado na ordem lexicográfica, 


/** Classe que representa um ponto no plano com coordenadas inteiras */ 
public class Point2D | 
protected int xc, vc; ¿coordenadas 


public Point: DXint x, int y) [ 
XG =X; 
ус = у; 


} 

public int getX() { return xc; } 

public int getY() { return ус; ] 
і 


Trecho de código 8.3 Classe que representa pontos em um plano com coordenadas inteiras. 


O TAD fila de prioridade 


Tendo descrito os padrões composição e comparator, será definido agora o TAD fila de priorida- 
de, que suporta os seguintes métodos para a fila de prioridade P: 
size( k retorna o número de entradas em P; 
isEmpty() testa se P está vazia; 
min(k retoma (mas nào remove) um entrada de P com a menor chave; uma 
condição de erro ocorre se P estiver vazia; 
insert(k,xk: inserte em P a chave k com o valor x e retoma a entrada armazenada; 
uma condição de erro ocorre se & é inválido (isto é, k não pode ser com- 
parado com outras chaves); 
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removeMin(): remove de P e retorna uma entrada com a menor chave; uma condição 
de erro ocorre se P estiver vazia. 


Como mencionado acima, os métodos primários do TAD fila de prioridade são as operações 
de insert e removeMin. Os outros métodos são a operação de consulta min e operações gerais de 
coleções size e isEmpty. É permitido que uma fila de prioridade tenha múltiplas entradas com a 
mesma chave. 


Uma Interface Java para fila de prioridade 


Uma interface Java, chamada PriorityQueue, para o TAD fila de prioridade é apresentado no 
Trecho de código 8.4. 


/** Interface para o TAD fila de prioridade */ 
public interface PriorityQueue--K,V-- [ 
/** Retorna o número de itens em uma fila de prioridades. */ 
public int size ); 
/** Retorna se a fila de prioridade está vazia, */ 
public boolean isEmptyl ): 
/** Retorna mas nào remove um entrada com chave minima. */ 
public Entry - K,V-- mini) throws Empty PriorityQueueException; 
/** |nsere um para chave-valor e retorna a entrada criada. */ 
public Entry — KM ingert(K key, V value) throws InvalidKeyException; 
/** Remove e retorna uma entrada com chave minima. */ 
public Entry K,V-- ramoveMin( ) throws EmptyPriorityQueveException; 


Trecho de código 84 Interface Java para o TAD fila de prioridade. 


Deve estar bastante óbvio agora que o TAD fila de prioridade € muito mais simples do que o 
TAD segliência. Esta simplicidade se deve ao fato de que os elementos em uma fila de prioridade 
são inseridos e removidos baseando-se inteiramente em suas chaves, enquanto os elementos em 
sequências são inseridos e removidos de acordo com suas posições e índices, 


Exemplo 8.4 А rabela a seguir mostra uma seqiiéncia de operações e seus efeitos sobre uma 


fita de prioridade P inicialmente vazia. Marca-se com e, um objeto entrada retornado do método 


insert A coluna “Fila de prioridade” é um pouco enganosa, já que mostra as entradas ordena- 
das pelas chaves. [sto é mais do que é requerido pela fila de prioridades. 


insert(5.A) | е [= (5,43). 
insert(9,0) | ex[2(9,C)] 
insert(3,8) | [= ( 3, В] [(3, В), (5,4), (9, C] 
insert(7. D) | e[2 (7, D)] | ((3,8), (5,4), (7, D), (9, C)] 
mini) es | 143, BROS A0, D), (9,0) | 
removeMin ( ) ёз | [ (5,4), (7,09,(9, СУ 
| 


[(5,4)] 
[65,4),(9,C)] 


size() 3 | 105,43, 07, Di9, CH} 
removetin i ) £i UT. D3,(9,C)] 
removeMin i ) £a (09,05) 
remowveMin ( ) £a {| 
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A classe java.util. PriorityQueue 


Não existe uma interface de fila de prioridades em Java, porém Java inclui uma classe, java util, 
PriorityQueve, a qual implementa a interface java.util Queue. Em vez de adicionar e remover 
elementos de acordo com a política FIFO, que é uma política padrão para filas, a classe java. 
util, PriarityQueue processa as entradas de acordo com a prioridade. Esta prioridade é definida 
por um objeto comparador, que é enviado para o contrutor da fila, ou é definido pela ordenação 
natural dos elementos armazenados na fila, Embora a classe java util. PriorityQlueue seja baseada 
na interface java util. Queue, pode-se definir uma simples correspondência entre os métodos desta 
classe e nosso TAD de fila de prioridade, como mostrado na Tabela 8.1, assumindo que se tem 
uma classe PQEntry, que implementa a interface Entry. 


TAD de fila de priodidade " Classe java.util. PrioritrQueue 
size ) == E size) 
isEmpty() isEmpty() 
|» — insert(k, v) offerinew POEntry(&, v)) or addinew POEntry(E, v 9 
_ mini) M peek), or elementi | 
| ramoveMin( ) Kr poll) or removed | 


Tabela 3.1 Métodos do TAD fila de prioridades e métodos correspondentes da classe java util 
PriorityQueue, Assume-se que o comparador para objetos POEntry é essencialmente o mesmo 
comparador para as chaves da fila de prioridades. O java.util.PriorityQueue tem um par de méto- 
dos para operações principais. 


8.1.4 Ordenando com uma fila de prioridade 


Outra aplicação importante de uma fila de prioridade é a ordenação, na qual tem-se uma coleção 
5 de n elementos que podem ser comparados com uma relação de ordem total e devem ser re- 
arranjados em ordem crescente de chave (ou em ordem não-decrescente, se houver empates), O 
algoritmo para ordenar 5 com uma fila de prioridade ©, chamado PriorityQueueSort, é bastante 
simples e consiste nas duas fases a seguir: 


і. Na primeira fase, os elementos de $ são colocados em uma fila de prioridade P inicial- 
mente vazia através de uma série de operações insert, uma para cada elemento de 5. 

2. Na segunda fase, os elementos de P são retirados em ordem não-decrescente através de 
n operagoes removeMin, colocando-os novamente em 5 em ordem. 


O pseudocódigo desse algoritmo é mostrado no Trecho de código 8,5, pressupondo que Sé 
uma sequência (um pseudocódigo para um tipo de coleção diferente, como uma lista ou arranjo, 
sena semelhante). O algoritmo funciona corretamente para qualquer fila de prioridade P, não 
interessando como P é implementada, Entretanto, o tempo de execução do algoritmo é determi- 
nado pelos tempos de execução das operações insert e removeMin, que dependem de como P é 
implementada, Assim, PriorityQueueSort deve ser considerada mais um “esquema” de ordenação 
do que um algoritmo, porque ele não especifica como P deve ser implementada. O esquema Prio- 
rityQueveSort é o paradigma de vários algoritmos populares de ordenação, incluindo selection 
sort, insertion sort e heapsort, que serão discutidos neste capítulo, 
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Algoritmo PriorityQueueSort(5, P 

Entrada: uma sequência 5 armazenando n elementos para os quais uma relação de ordem 
total está definida e uma fila de prioridade P que compara chaves usando a mesma relação 
de ordem total. 

Saida: à sequência $ ordenada pela relação de ordem total. 

enquanto 15 isEmpty() faça 
e E S.removeFirst() 
P inserte, 0) [um valor nulo é utilizado | 

enquanto 'P isEmpty faça 
e e P.removeMin().getkeyt | 
SaddLast(e) to menor elemento de P é adicionado no final de 5] 


Trecho de código 8.5 Algoritmo PriorityQueueSort. Observe que os elementos da sequência $ 
servem tanto como chaves quanto como elementos da fila de prioridade P. 


8.2 Implementando uma fila de prioridade com sequências 


Nesta seção será apresentado como implementar uma fila de prioridade por meio do armazena- 
mento de entradas em uma lista 4. (Veja Capítulo 6.2.) Duas alternativas são fornecidas, depen- 
dendo se forem mantidas as chaves em $ ordenadas ou não. Quando é analisada a execução dos 
métodos da fila de prioridades implementados com uma sequência, assume-se que a comparação 
das duas chaves ocorrem em um tempo C L). 


8.2.1 Implementação com uma sequência náo-ordenada 


Como na nossa primeira implementação de fila de prioridade P, considera-se o armazena- 
mento das entradas de P em uma següencia $, onde 5 é implementada com uma lista dupla- 
mente encadeada Desta forma, os elementos de 5 são pares (К, x), onde k é uma chave x é 
um valor. 


Inserções rápidas e exclusões lentas 


Uma forma simples de implementar o método insertík, x) em P é criar um novo objeto e = (E, x) 
e adicioná-lo no final da lista 5, executando o método addLast(e) de 5. Esta implementação do 
método insert tem tempo Oil). 

Esta escolha implica que 5 não será ordenada, pois a inserção sempre no final de 5 não leva 
em conta a ordem das chaves, Como consequência, para realizar a operação min ou removeMin 
em P. deve-se inspecionar todos os elementos de 5 para encontrar o elemento p = (k, €) com o 
menor valor de k Assim, independentemente de como a seqüencia 5 é implementada, esses mé- 
todos de procura em P sempre custam tempo (т) onde n é o número de elementos em P quando 
o método é executado. Adicionalmente, esses métodos são executados em tempo proporcional 
para n, mesmo no melhor caso, pois cada um deles requer que toda a sequência seja pesquisada 
para se encontrar o menor elemento. Ou seja, usando a notação apresentada na Seção 4.2.3, 
pode-se dizer que estes métodos são executados em tempo &(n). Finalmente, implementam-se 
os métodos size e isEmpty que simplesmente retornam a saida das execuções dos métodos cor- 
respondentes da lista 5. 

Desta forma, usando uma seqüéncia não-ordenada para implementar uma fila de prioridade, 
obtemos inserção em tempo constante é obtida, mas a pesquisa e remoção exigem tempo linear. 
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8.2.2 Implementação com uma sequência ordenada 


Uma implementação alternativa para uma fila de prioridade P também usa uma sequência $, mas 
desta vez os elementos são armazenados em ordem de chave. Especificamente, a fila de priorida- 
des P é representada usando a sequência de entradas ordenadas de forma crescente pela chave, o 
que significa que o primeiro elemento de $ é o elemento com a menor chave. 


Rápida remoção e inserção lenta 


Pode-se implementar o método min, neste caso, simplesmente acessando o primeiro elemento 
da sequência usando o método first de $, Da mesma forma, implementa-se o método removeMin 
de P como sendo S.remove(S.first( |). Assumindo que $ seja implementada como uma lista du- 
plamente encadeada, os métodos min e removeMin de P têm tempo O(1). Desta forma, usando 
uma sequência ordenada, permite uma simples e rápida implementação dos métodos de acesso c 
remoção de uma fila de prioridades, 

Este beneficio tem um custo, no entanto, pois agora o método insert de P requer que à se- 
quência $ seja vasculhada para determinar a posição apropriada para inserir o novo elemento e 
sua chave. Assim, implementar o método Insert de P agora exige tempo Oin) onde n é o número 
de elementos em P no momento em que o método é executado. Em suma, quando uma sequência 
ordenada é usada para implementar uma fila de prioridade, a inserção é executada em tempo 
linear, enquanto a busca e à remoção de mínimos podem ser feitas em tempo constante. 


Comparando as duas implementações 


A Tabela 8.2 compara os tempos de execução dos métodos de uma fila de prioridade implemen- 
tada com sequências ordenadas e não-ordenadas, respectivamente. Uma sequência não-ordenada 
permite inserções rápidas, mas consultas e remoções lentas, enquanto que uma seglléncia orde- 
nada permite consultas € remoções rápidas e inserções lentas. 


Sequéneia =  Seqüéncia 


Tabela 8.2 Piores casos na execução dos métodos de uma fila de prioridade de tamanho п, im- 
plementada com uma següéncia não-ordenada e seqiiéncia ordenada, respectivamente, Assume- 
se que a seqüéncia é implementada com uma lista duplamente encadeada. O espaço requerido é 
Din). 


implementação Java 


Os Trechos de código 8.6 e 8.8 mostram a implementação em Java da fila de prioridades ba- 
seada em uma sequência ordenada de nodos. Esta implementação usa uma classe aninhada 
chamada MyEntry, que implementa a interface Entry (veja Seção 6.5.1), O método auxiliar 
checkKey(k), o qual lança uma exceção chamada InvalidKeyException se a chave k não puder 
ser comparada com o comparador da fila de prioridade, não é mostrado. A classe DefautCom- 
parator, que implementa o comparador usando ordenação natural, é apresentado no Trecho 
de código 8.7. 
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import java util. Comparator; 
/** Implementação da fila de prioridade através de uma sequencia ordenada de nodos. */ 
public class SortedListPriority/Queue - КА implements PriorityQueue- K,V-- [ 
protected PositionList - Entry K,V > > entries; 
protected Comparator=K= c; 
protected Position Entry K,W>= actionPos; H variável usada pela subclasse 
/** Classe interna para Entradas */ 
protected static class MyEntry - КА implements Епїгү< KV [ 
protected K k; // chave 
protected V v; // valor 
public MyEntry(K key, V value) I 
k = key; 
v = value; 


| 

if métodos da interface Entry 
public K getKey() { return k; ) 
public Y getvaluel | | return v; | 


= Спа uma fila de prioridades com o comparador padrão. */ 
public SortedListPriortyQueue ( } { 

entries = new NodePositionList- Entry - K,V---( |; 

c = new DefaultCemparator- K (Yr 
) 
/** Спа uma fila de prioridades com um comparador informado. */ 
public SortedListPriorityQueve (Comparator="K > compl [ 

entries = new NodePositionList<Entry<KV>>{]; 

e = comp; 


Trecho de código 8.6 Parte da classe java SortedListPriorityQueue, que implementa a interface 
Priority Queue. A classe aninhada MyEntry implementa a interface Entry (continua no Trecho de 
código 2.8). 


/** Comparador baseado na ordenação natural 
ы 
public class DefaultComparator-E-- implements Comparator=E => [ 
¿22 Compara dois elementos informados 
"yj 
public int compare(E a, E bj throws ClassCastException | 
return ((Comparable--E--) a).compareTo(b); 
| 
i 


Trecho de código 8.7 Classe java DefaultComparator que implementa um comparador usando 
a ordenação natural e é o comparador padrão da classe SortedListPriorityQueve. 


¿** Retorna mas não remove uma entrada com a menor chave. */ 
public Entry <КМ» min (| throws EmptyPriorityQuevsException { 
if (entries isEmptyt }} 
throw new EmptyPriorityQueveException("Fila de prioridades está vazia "} 
else 
return entries. firsti elementi |; 
} 
/** Insere um par chave-valor e retorna o elemento criado. */ 
public Entry =K W> insert (КОК, Y v) throws InvalidKeyException [ 
checkKeyik); // método auxiliary para verificação da chave (pode lança uma exceção) 
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o(ns(n-1)+--+2+1)=0 [Si], 


Pela Proposição 4.3, tem-se EL i=m(n+ 1) / 2. Assim, a segunda fase custa tempo Am), 
como, o algoritmo completo. 

Seqiiéncia 5 Fila de prioridade 

(7,4,8,2,5,3,9) | ü 


Fase | (ар | (4,8,2,5,3, 9) (7) 
(b)| (82539 (7,4) 

{} (7,4,8,2,5,3,9) 

AD) | (14,85,3,9) 

(2,3) (7,4, 8,5, 9) 

(7, 8,5, 9) 


(3, 3, 4,5, 7, 8) 
(2, 3,4, 5, 7, R&, 9) 1) 


Figura &.1 Execução do algoritmo selection-sort na seqüéncia 5 = (7,4,8,2,5,3,9). 


Insertion-Sort 


Se a fila de prioridade P for implementada com uma sequência ordenada, pode-se melhorar o 
tempo de execução da segunda fase para Or), pois cada operação removeMin em P custa tempo 
OCT). Infelizmente, neste caso, a primeira fase se torna o gargalo para o tempo de execução, visto 
que, no pior caso, o lempo de execução de cada operação insert é proporcional ao tamanho de P. 
Este algoritmo de ordenação é, portanto mais conhecido como insertion sort (ver Figura 8.2), 
pois o seu gargalo envolve a repetida “inserção” de um novo elemento na posição apropriada da 
sequência ordenada. 


Seqüéncia 5 | Fila de prioridade! 


| Entrada (7,4,8,2,5,3,9) 0 

Fasel (а) | (4,8,2,5,3,9) (Ту 
(b)| {8,2,5,3,9) (4,7) 
{с} (2,5,3,9) td, 7, 81 
id) (5.3.9) (2,4,7,8) 
(e) (3,9) (2,4,5,7,8) 
i (9) (2,3,4,5, 778) 
w Y (2,3,4,5, 7, 8,9) 

Fase 2 (а) (3 (3,4,5,7,8,9) 


(bi (2,3) (4,5,7,8,9) 


(я) |(2,3,4,5,7,8,9) | Y 


Figura 8.2 Execução do insertion sort na seqüeéncia $ = (7, 4, B. 2, 5, 3, 9). 
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a ver com o heap de memória (Seção 14.1.2) usado no ambiente de execução de uma linguagem 
de programação como Java, 

Definindo-se o comparador para indicar о oposto da relação de ordem total entre as chaves 
(de forma que, compare(3,2) = 0, por exemplo), então a raiz do heap irá armazenar a chave 
maior. Essa versatilidade advém diretamente do uso do comparador padrão. Pela definição da 
chave mínima em termos de comparador, à chave “minima” com o comparador “reverso” e ela 
será de fato a maior do heap. 


Figura 8.3 Exemplo de um heap armazenando 13 chaves inteiras. O último nodo é o que ar- 
mazena a chave (8, Wi. 


Assim, sem perda da generalidade, pode-se assumir que se está sempre interessado na chave 
minima. que estará sempre na raiz do heap. 

Para aumentar a eficiência, como será mostrado mais tarde, um heap T deve ter a menor altu- 
ra possível, Efetiva-se esse requisito por meio de uma condição estrutural adicional: o heap deve 
ser completo, Antes de definir esta propriedade estrutural, algumas definições são necessárias. 
Fon visto na Seção 7.3.3 que o nível ў de uma árvore binária 7 é o conjunto de nodos de T que 
tem profundidade i. Dados os nodos v e w no mesmo nível de T, diz-se que v está à esquerdo de 
w se vé encontrado antes de w em um caminhamento interfixado de T. Isto é, há um nodo s em 
Fem que v está па subárvore à esquerda de w é w está na subárvore à direita de u. Por exemplo. 
na árvore hinária da Figura 8.3, o nodo armazenado па chave (15, K) está à esquerda do nodo 
armazenado na chave (7,0. Em um padrão de projeto de árvores binárias, a relação "à esquerda” 
é visualizada pelo posicionamento horizontal relativo dos nodos. 


Arvore binária completa: uma árvore binária T com altura h é completa se os niveis 0, 1,2,..., 
һ — À tiverem o maior número de nodos possível (ou seja, o nível / tem 2 nodos рага 0 = i 
= й — lie nonivel — [todos os nodos internos estão à esquerda dos nodos externos, 


Insistindo que um heap T seja completo, identifica-se outro nodo importante do heap T. 
diferente da raiz: o Miuno nodo de T, delinida como sendo o nodo mais interno e mais à direita 
de T (ver Figura 8.3) 

Altura de um heap 


Percebe-se que A indica a altura de 7, Outra forma de definir o último nodo de Té verificar o nodo 
que está no nível А e em que todos os outros nodos do nível h estejam a esquerda deste. Insistir que 
T seja completo também tem uma importante consegiiéncia, como mostrado na Proposição 8.5. 


Proposição 8.5 Um heap T armazenando n chaves tem altura. 
n = Log nl 


А Fila de Prioridade 305 
Justificativa Já que T é completo, o número de nodos internos é pelo menos 


ESETET +" pj=9"" = 4 | 


pl i 
Este limite inferior é obtido quando existe apenas um nodo interno no nivel At. Além disso, mas 
também vindo do fato de que T é completo, tem-se que o número de nodos de 7 é no máximo 
I+2+4+. 20 = 00 1, 


a Р a А Р й Р 
Este limite superior é alcançado quando o nível hi tem 2 nodos. Desde que o número de no- 
dos é igual ao número de n chaves, obtem-se 


"en 
e 
nett. 
Assim, usando logaritmos de ambos os lados dessas desigualdades, vê-se que 
h = løg n 
А 


login + 1) — 1 А. 
Desde que В é um numero inteiro, as duas desigualdades acima implicam que 
h= Log п] 
" 


A Proposição 8.5 tem uma consequência importante, pois ela indica que se operações de atu- 
alização no heap forem realizadas em um tempo proporcional a sua altura, então essas operações 
serão feitas em tempo logarítmico. O problema agora é. portanto, como efetuar eficientemente 
vários métodos de uma fila de prioridade usando um heap. 


83.2 Árvores binárias completas e suas representações 


A seguir, será discutido mais sobre arvores binárias completas e como representä-las. 


O TAD árvore binária completa 


Como um tipo de dado abstrato, uma árvore binária completa T implementa todos os métodos de 
um TAD árvore binária (Seção 7.3.1), adicionando os dois seguintes métodos: 
addiel: adiciona em T e retorna um novo nodo externo v armazenando o ele- 
mento o, no qual a árvore resultante é uma árvore binária completa 
com o último nodo sendo v. 


remove( Remove o último nodo de T retornando-o. 

Usando somente estas operações de atualização, sempre se terá uma árvore binária completa, 
como apresentado na Figura 8.4, na qual há dois casos para a realização de uma adição ou remo- 
ção. Especificamente, para uma adição, tem-se o seguinte (remoção é similar), 

+ Se o nível inferior de T não estiver completo, então add insere um novo nodo no nivel 


inferior de T, imediatamente após o nodo mais a direita deste nivel (sto é o último nodos, 
então, a altura de T continua à mesma. 
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e Seonivel inferior estiver cheio, então add insere um novo nodo como um filho à esquerda 
do nodo mais a esquerda do nível inferior de T; então, a altura de T incrementa em um, 


Ра 
«D psu 
So So „о о cv 
(c) (di 


Figura 8.4 Exemplos das operações add е remove em uma árvore binária completa, onde иг 
indica o nodo inserido pelo método add ou removido pelo método remove. As árvores apresen- 
tadas em (b) e (d) são resultados da execução do método add nas árvores apresentadas em (a) 
e (c), respectivamente. Da mesma forma, as árvores apresentadas em (a) e (c) são resultados da 
execução do método remove nas árvores apresentadas em (b) e (d), respectivamente. 


A representação de arranjo de uma árvore binária completa 


A representação da árvore binária como arranjo (Seção 7.3.5) é especialmente apropriada para 
uma árvore binária completa T. Já foi visto que nesta implementação, os nodos de T são armare- 
nados em um aranjo À no qual o nodo v de Té o elemento de A com índice igual ao nivel piy) 
de v, definido como segue: 


e Sevéaraiz de T. então pir} = 1. 
* Sevéonodo filho a esquerda do nodo m, então piv} = Ipin). 
+ Sevéonodo filho a direita do nodo n, então piv) = 2p(u) + I. 


Com esta implementação, os nodos de T têm indices continuos no intervalo [1 1] e o último 
nodo de T tem sempre o indice m, onde n é o número de nodos de T. A Figura 8.5 apresenta dois 
exemplos ilustrando esta propriedade do último nodo. 


€ " SÅ 
24 yc of 
МЈ — ki 
(a) (b) 
001212345306 01232345067 8 
w la! 
(c) (d) 


Figura 8.5 Dois exemplos apresentando que o último nodo w do heap com n nodos tem 5 
niveis: (a) heap T, com mais de um nodo no nivel inferior; (b) heap T, com um nodo no nivel 
inferior; (c) representação de arranjo de Т; (d) representação de arranjo de T,. 
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Figura 8.7 Inserção de um novo elemento com chave 2 no heap da Figura 8.6: (a) heap inicial; 
(b) após execução do método add; (c e d) troca local, restaurando parcialmente a propriedade de 
ordem; (e e Г) outra troca; (р e h) troca final. 


+ Serão possui filho a direita, então s será filho a esquerda de г, 
* De outra forma (r tem ambos os filhos), s será um filho de r com a menor chave. 


Se kir) = hs), a propriedade de ordem do heap está satisfeita e o algoritmo finalizado. Caso 
contrário, se Ar) > kis), será preciso restaurar a propriedade de ordem do heap, o que pode ser 
feito localmente pela troca de elementos armazenados em re s. (Ver Figura 8.8c e d. {Não seria 
preciso trocar r com irmãos de s.) À troca restaura a propriedade ordem do heap para o nodo re 
seus filhos. mas pode violar esta propriedade em s; portanto, pode ser necessário continuar fazen- 
do trocas em T até que não aconteça mais uma violação. (Ver Figura 8.8e e h.) 

Essas trocas descendentes são chamadas de down-heap bubbling. Uma troca resolve a vio- 
lação da propriedade ou a propaga um nível para baixo no heap. No pior caso, uma par chave- 
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elemento move-se todo o caminho até o nível imediatamente acima do último. (Ver Figura 8.8.) 
Assim, o número de trocas executadas na execução do método removeMin é. no pior caso, igual 
a altura do heap T. isto é, Llog n] pela Proposição 8.5. 


A Tabela 8,4 mostra o tempo de execução dos métodos do TAD fila de prioridade para a imple- 
mentação baseada em heap, assumindo que duas chaves podem ser comparadas no tempo OX 1) e 
que o heap T está implementada ou como um arranjo ou como uma lista encadeada. 


iac 


Análise 
| 
| 


Figura 8.8: Remoção do elemento com a menor chave do heap: (a e b) remoção do último nodo, 
que possui o elemento armazenado na raiz; (c e d) troca localmente para restaurar a propriedade 
de ordem do heap; (e e f) outra troca; (g e h) troca final, 
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comp.compare(key. key): 
} 
catch(Exception e) [ 
throw new invalidKeyException("Chave Inválida") 
} 
} 


Trecho de código 8.14 Métodos min, insert e removeMin e alguns métodos auxiliares da classe 
HeapPriorityQueue. (Continua no Trecho de código 8.15.) 


/** Executa up-heap bubbling */ 
protected void upHeap(Position- Entry =K, V >> v) ( 
Position<Entry<K,V>> u; 
while (!heap.isRootiv)) { 
u = heap.parent(v); 
if (comp.compare(u.element( ).getKey(), v.element( ).getKey( }} <= 0) break, 
swap(u, v); 
v—u; 


| 


} 
/** Executa down-heap bubbling */ 
protected void downHeap(Position-- Entry « K,V => г) 4 
while (heap.isinternakfr)) { 
Positions Entry aK W> в ¿Fa posição do menor filho 
if 'heap.hasRightir)) 
5 = heap.leftir); 
else if (comp.comparel[heap.leftr).element( ).getKey( ), 
heap.right(r).elemanti J.getKeyí j} <=0) 
s = heap.leftir); 
else 
s = heap.rightir); 
if (comp.compara(s.elementí ).getKeyl ), nelement().getKey()) < 011 
swapir, =); 
rz 
I 
else 
break; 
} 
} 
/** Troca as entradas das duas posições */ 
protected void swap(Position<Entry <K,V>> x, Position<Entry<K,W>> y) | 
Entry<K,V> temp = x.element( |; 
heap.replace(x, y. element( )); 
heap.replace(y, temp): 


} 
Pek Texto de visualização para verificação */ 
public String toStringl ) 1 
return heap.toStringl J; 
} 


Trecho de código 8.15 Métodos auxiliares restantes da classe HeapPriorityQueve. (Continua- 
ção do Trecho de código 8.14.) 
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8.3.5 


Heap-sort 


Como já observado, construir uma fila de prioridade com um heap traz a vantagem de que todos 
os métodos do TAD fila de prioridade são executados em tempo logarítmico, ou melhor, Portan- 
to, esta construção é adequada para aplicações em que tempos velozes são exigidos para todos 
os métodos da fila de prioridade, Desta forma, considera-se novamente o esquema de ordenação 
PriorityQueueSort, da Seção 8.1.4, que usa uma fila de prioridade P para ordenar uma seguência 
S com m elementos, 

Durante a primeira fase, а Pésima operação insert (1 = é = n) leva o tempo Oil + log ñ. 
desde que о heap tenha г elementos após à operação ser executada, Da mesma forma, durante 
a segunda fase, а j-ésima operação removeMin (1 = j = rm) executa no tempo CAT + login =j 

+ Dy». desde que o heap tenha a — j + 1 elementos no momento da execução da operação. As- 
sim, cada fase leva o tempo On log n), assim o algoritmo de ordenação da fila de prioridades 
executa no tempo On log m quando um heap é usado para implementar a fila de prioridades. 
Este algoritmo de ordenação é mais conhecido como heap-sort, e seu desempenho é resumido 
na seguinte proposição. 


Proposição 86 O algoritmo heap-sort ordena uma seqiiéncia 5 de n elementos no tempo 
On log n, assumindo que dois elementos de N podem ser comparados no tempe OU). 


Enfatiza-se que o tempo de execução (Mn log n) do heap-sort € consideravelmente melhor do 
que o tempo de execução Ca?) do selection-sort e do insertion-sort (Seção 8.2.3). 


Implementando heap-sort 


Se a sequencia $ a ser ordenada é implementada através de um arranjo, pode-se acelerar o heap- 
sort e reduzir sua necessidade de memória em um fator constante usando uma parte da própria 
sequência $ para armazenar o heap, dessa forma evitando o uso de uma estrutura de dados heap 
externa. Isto é feito moditicando-se e algoritmo da forma a seguir: 


1. Usa-se um comparador reverso, o que corresponde a um heap com o maior elemento no 
topo. À qualquer momento durante a execução do algoritmo, utiliza-se a parte esquerda 
de 5 até uma certa posição | — | para armazenar os elementos no heap, e a parte direita 
de $ das posições i até n | para armazenar os elementos da sequência. Assim, os 
primeiros + elementos de 5 (nas posições 0, ..., 1 — 1) fornecem uma representação ve- 
torial para o heap (com numeração iniciando em 0 e não mais em 1), ou seja, o elemento 
па posição & do heap é maior ou igual aos “filhos” nas posições 26 + Te 2& + 2, 

2, Na primeira fase do algoritmo, começa-se com um heap vazio e move-se a fronteira 
entre o heap e a segiiência da esquerda para a direita um passo de cada vez. No passo i 
(t= l... expande-se o heap adicionando o elemento na posição — 1. 

3, Na segunda fase do algoritmo, inicia-se com uma seqüéncia vazia e move-se à fron- 
teira entre o heap e a sequência da direita para à esquerda, um passo de cada vez. 
No passo dd = Do... n) o maior elemento do heap é removido e armazenado na 
posição т = i. 


A variação do heap-sort acima é dita in-place, pois ela usa um espaço adicional constante 
além da própria sequência. Em vez de retirar elementos da seqüéncia e depois recolocá-los, eles 
são simplesmente rearranjados. Esta versão do heap-sort é ilustrada na Figura 8,9. Em geral, um 
algoritmo de ordenação é in-place se ele usa uma quantidade constante de memória além da me- 
möra necessária para armazenar os elementos a serem ordenados, 
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Figura 8.9 Os primeiros três passos da primeira fase do heap-sort in-place. À porção do heap 
da sequência está demarcada em cinza. Desenhamos ao lado do arranjo a árvore binária represen- 
tando o heap, mesmo que esta árvore não seja realmente construída pelo algoritmo in-place. 


8.36 Construção bottom-up do heap + 


А análise do algoritmo heap-sort mostra que é possível construir um heap armazenando n pares 
chave-elemento em tempo Os log n) através de m operações insertitem, e depois usar o heap 
para retirar os elementos em ordem decrescente. No entanto, se todas as chaves a serem arma- 
zenadas no heap forem dadas previamente, existe um método alternativo de construção que 
monta o heap de baixo para cima (bottom-up) em tempo (Hr). Esse método será descrito nesta 
seção, observando que ele poderia ser incluído como um dos construtores de uma classe que 
implementa uma fila de prioridades baseada em heap. Para manter a simplicidade, essa forma de 
construção será descrita pressupondo que o número л de chaves é um inteiro da forma m = 2º 
— |. Ou seja, o heap é uma árvore binária completa com cada nível completo, portanto tem al- 
tura h = login + 1) — E Vista de forma não-recursiva, a construção bottom-up do heap consiste 
nos seguintes fr + 1 = login + 1) passos: 


1. No primeiro passo (ver Figura 8. 10а), constrói-se (n + 1/2 heaps elementares, armaze- 
nando uma chave cada um. 

2. Mo segundo passo (ver Figura б. Њу, forma-se (nt + 1/4 heaps armazenando trés 
chaves cada um. simplesmente unindo pares de heaps elementares e adicionando uma 
nova chave. À nova chave é colocada na raiz e pode precisar ser trocada com à chave 
colocada em um de seus filhos para preservar a propriedade de ordem do heap. 

à, Nolerceiro passo (ver Figura 8. 10d-e), forma-se (1 + 1/6 heaps armazenando sete chi- 
ves cada um, unindo pares de heaps com três chaves (construídas nos passos anteriores) 
e adicionando uma nova chave. À nova chave é colocada inicialmente na raiz, mas pode 
ter de passar pelo processo de down-bubbling para preservar a propriedade de ordem do 
heap. 
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i. No i-ésimo passo genérico, com 2 = i - h, forma-se (n + 1)/2 heaps armazenando 2 — 
1 chaves cada um, unindo pares de heaps com (2º ' — 1) chaves (construídas nos passos 
anteriores) e adicionando uma nova chave, A nova chave é colocada inicialmente na 
raiz, mas pode ter de passar pelo processo de down-bubbling para preservar a proprie- 
dade de ordem do heap. 


h- 1. No último passo (ver Figura 8.10£-g). forma-se o heap final, armazenando todos os n 
elementos, pela união de dois heaps com (n — 1/2 chaves (construidas nos passos an- 
teriores) e adicionando uma nova chave. A nova chave é colocada inicialmente na raiz, 
mas pode ter de passar pelo processo de down-bubbling para preservar a propriedade de 
ordem do heap. 


А construção bottom-up do heap é mostrada na Figura 8.10 com A = 3. 


Construção recursiva bottom-up do heap 


Podemos descrever a construgáo bottom-up do heap de forma recursiva, como apresentado no 
Trecho de código 8.16, em que é passado por parâmetro uma lista de pares chave-valor que serão 
utilizados para a criação do heap. 


Algoritmo BattomUpHeap( 5): 

Entrada: uma sequência L armazenando п = 2" 1 entradas 

Saida: vm heap T armazenando as entradas em L 

se 5 isEmpty() então 
retorna um heap vazio 

E — Lremove(Efirst()) 

Separa Lem duas sequências L, e La. cada uma com o tamanho (n — 12 

Т, = BottomUpHeapil, } 

T, = BottomUpHeapi£.) 

Cria uma árvore binária T com raiz r armazenando e, tendo a subárvore а esquerda Т e a 
subárvore a direira Т, 

Executa um down-heap bubbling a partir da raiz r de T. se necessário. 

retorna T 


Trecho de código 8.16 Construção recursiva bottom-up do heap. 


Construção bottom-up do heap é assintoticamente mais rápido que a inserção incremental de 
n chaves em um heap inicialmente vazio, como é apresentado na seguinte proposição. 


Proposição 8.7 Contrução bottom-up de um heap com n elementos custa o tempo On), assu- 
mindo que duas chaves podem ser comparadas no tempo CNI). 

Justificativa Analisa-se a construção bottom-up do heap usando uma abordagem “visual”, 
como é ilustrado na Figura 8.11. 

Sendo T o heap final e v um nodo de 7, denota-se como Лу) a subárvore de T com raiz v. 
No pior caso, o tempo para formar T(v) a partir das duas subárvores formadas recursivamente 
e tendo os filhos de v em suas raízes é proporcional à altura de T(v). O pior caso acontece 
quando o down-heap bubbling a partir de v atravessa um caminho de v até um dos nodos mais 
externos de Tv). 

Considere-se agora o caminho piv) em T, do nodo v até seu sucessor externo (em um ca- 
minhamento prefixado), ou seja, o caminho que inicia em v, visita o filho direito de v e desce 
sempre para a esquerda até chegar a um nodo externo. Diz-se que o caminho piv) é associado 
com o nodo v. Observa-se que p(v) não é necessariamente o caminho seguido em um down-heap 
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Figura 8.10 Construção bottom-up de um heap com 15 chaves: (a) incia-se pela construção 
da chave 1 no nível inferior; (be c) combinam-se estes heaps em 3 chaves e então (d e e) 7 
chaves, até (fe g) que se спа o heap final, Estes caminhos do down-heap bubblings estão de- 
marcados em cinza. Para simplificação, está-se mostrando somente a chave de cada nodo ao 
invés de todo o elemento. 


bubbling quando Tir} é formado. Claramente, o comprimento (número de arestas) de piv) € igual 
à altura de T(v). Portanto, formar Гу) toma no pior caso tempo proporcional ao comprimento 
de piv). Assim, o tempo de execução total da construção bottom-up é proporcional à soma dos 
comprimentos dos caminhos associados aos nodos internos de T. 

Observa-se que cada nodo v de T distinto a partir da raiz pertence exatamente a dois ca- 
minhos: o caminho plv) associado com v e o caminho plu) associado com os pais de eu de v. 
(Ver Figura 8.11.) Além disso, a raiz r de T pertence somente ao caminho p(r) associado com r. 
Portanto, a soma dos comprimentos dos caminhos associados aos nodos internos de T é 2n— 1. 
Conclui-se que a construção bottom-up do heap T leva o tempo (An). L| 
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Figura 8.11 Justificativa visual do tempo de execução linear do algoritmo de construção bot- 
tom-up do heap. onde os caminhos associados aos nodos internos são mostrados com cores alter- 
nadas, Por exemplo, o caminho associado com a raiz consiste nos nodos armazenando as chaves 
4.6.7 e 11. Além disso, e caminho associado com a filho a direita da raiz consiste dos nodos 
internos armazenando as chaves б, Me 23. 


Resumido, a Proposição 8.7 garante que o tempo de execução da primeira fase do heap-sort 
pode ser reduzido até Ow). Infelizmente, o tempo de execução da segunda fase do heap-sort não 
pode ser tornado assintoticamente melhor do que (Ha log at, ou seja, ele sempre será £3 (n log n) 
no pior caso, Este limite inferior não será justificado até o Capítulo 11. Conclui-se este capítulo 
discutindo um padrão de projeto que permite estender o TAD fila de prioridade dando-lhe fun- 
cionalidade adicional. 


8.4 Filas de prioridade adaptáveis 


Os métodos do TAD fila de prioridades apresentados na Seção 8.1.3 são suficientes para as apti- 
cações mais básicas de filas de prioridades, como um armazenamento. Entretanto, existem si- 
tuações em que métodos adicionais seriam úteis, como apresentados nos cenários abaixo, o qual 
refere-se à aplicação de fila de espera de passageiros para uma empresa de vôos comerciais. 


в Um passageiro pessimista sobre suas chances de ir a bordo pode decidir ir embora antes 
da entrada no avião, requisitando ser removido da lista de espera. Assim, se gostaria de 
remover da fila de prioridades a entrada associada a este passageiro. O método removeMin 
não é aplicado nesta situação desde que o passageiro a ser removido tenha a prioridade 
1. Em vez disso, se gostaria de ter um novo método remove(e) que remove um elemento 
qualquer e. 

+ Quiro passageiro procura seu cartão VIP e apresenta-o ao agente, Assim, sua prioridade 
tem que ser modificada conforme sua nova especificação. Para conseguir isso, se gostaria 
de ter um novo método chamado replaceKey(e KJ, que substitui com a chave k à entrada e 
na fila de prioridades. 

+ Finalmente, um terceiro passageiro notifica que seu nome indica que seu nome está escrito 
de forma errada no cartão de embarque solicitando a alteração, Para esta alteração, precisa- 
se alterar o registro do passageiro, Portanto, se gostaria de ter um novo método chamado 
replaceWalue(e, x) que substitui com x o valor da entrada e na fila de prioridades. 


8.4.4 Métodos do TAD fila de prioridade adaptável 


Os cenários apresentados anteriormente motivam para a definição de um novo TAD que estende 
o TAD fila de prioridades com os métodos remove, replaceKey e replaceValue. Em outras pa- 
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(por exemplo, por causa das trocas em um down-heap ou up-heap bubbling). O método 
replaceValue(e, x) custa o tempo O1) desde que se obtenha a posição p da entrada e no 
tempo O1) seguindo a localização das referências armazenadas com a entrada, Métodos 
remove(e) e replaceKey(e, К executam no tempo CN log n) (detalhes são explorados no 
Exercício C-8.22). Usar localizador aumenta o tempo de execução dos métodos insert e 
removeMin em um fator constante elevado. 


O uso do localizador para uma implementação de sequência não ordenada é explorado no 
Exercicio C-R.21. 


Desempenho das implementações de filas de prioridades adaptáveis 


O desempenho de uma fila de prioridades adaptável implementada por várias estruturas de dados 
com localizador é resumido na Tabela 8,4, 


Ford | mp | 

Método —  nàüo-ordenada | ordenada Heap | 

met | om 

min On) 

O(log n) 
EMT) 


A log n 


replaceValue | ort) 


Tabela 8.4 Tempos de execução dos métodos de uma fila de prioridades adaptável de tamanho 
n, implementada com uma sequência não-ordenada, uma sequência ordenada e um heap, respec- 
tivamente. O espaço requerido é Cr). 


8.4.3  Implementando uma fila de prioridade adaptável 


Os Trechos de código 8,17 e 8,18 apresentam a implementação Java de uma fila de prioridades 
adaptável baseada em uma sequência ordenada. Esta implementação é obtida pela extensão da 
classe SortedListPriorityQueue apresentada no Trecho de código 8.6. Em particular, o Trecho 
de código 8.18 apresenta como implementar um localizador em Java, estendendo uma entrada 
regular. 


/** Implementação de uma fila de prioridades adaptável com uma sequencia ordenada. */ 
public class SortedListAdaptablePriorityQueue=K,Y> 
extends SortedListPriorityQuaue<K,V> 
implements AdaptablePriorityQueue-- K, v= [ 
/** Cria uma fila de prioridades com o comparador padrão */ 
public SortedListAdaptablePriorityQueuei) { 
superi |; 


/** Спа uma fila de prioridades com um dado comparador */ 

public SortedListAdaptablePriorityQueuelComparator<K> comp) { 
super[comp); 

] 

/** |nsere um par chave-valor e retorna a entrada criada */ 

public Enty =K Y> insert (K k, V v) throws InvalidKeyException [ 
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checkKeyik]; 

LocationdwareEntry=K,V=> entry = new LocationdwareEnin K, V =k vE 
insertEntryientry); 

entry. setlocation(actionPos); ¿fposicio da nova entrada 

return entry; 


| 
/** Remove e retorna uma dada entrada */ 
public Entry-— КА remove(Entry-- KN == entry) f 
checkEntry(entry); 
Location/wareEntry SK V> e = (Lacatian&wareEntry-- К.Л) entry; 
Position Entry K,V---— p= elocation( ); 
entnes.removelp): 
e.setl ocationdnull); 
return e; 


/** Substitui a chave de uma dada entrada */ 
public K replaceKey(Entry--K,V-—- entry, K k} 1 
checkkKeyik); 
checkEntrylentry); 
LocationAwareEntry-— K,V- e = (LocationAwareEntry= KN >] removejentry): 
K oldKey = e.setKey(k); 
inzertEntryie}, 
e setLocationjactionPos); ff posição da nova entrada 
return oldkey: 
} 


Trecho de código 8.17 Implementação Java de uma fila de prioridades adaptável utilizando 
uma sequência ordenada armazenando localizadores. A classe SortedListAdaptablePriorityQueue 
estende a classe SortedListPriorityQueve (Trecho de código 8.6) e implementa a interface Adap- 
tablePriorityQueue. (Continua no Trecho de código 8.18.) 


/** Substitui o valor de uma dada entrada */ 
public Y replaceValue(Entry<K,V> e, V value) [ 
checkEntryie); 
V oldValue = ((Location&wareEntry-- К.М) e) setvaluelvalue): 
return oldValue: 
| 
/** Determina se uma dada entrada é válida */ 
protected void checkEntry(Entry ent) throws InvalidEntryException | 
ient == null | tent instanceof | осайопАмгагеЕпїгү)) 
throw new InvalidEntryExcention(" invalid entry"); 


/** Classe interna para um localizador */ 
protected static class LocationAwareEntry — K,V > 
extends MyEntry<K,V> implements Entry--K,V- [ 
/** Posição onde a entrada será armazenada. */ 
private Position Entry- K WV > > lac; 
public Location/wareEntryiK key, V value} { 
super(key, value); 
| 
public LocationAwareEntryiK key, V value, Position=Entry= К > pos) | 
superikey, value); 
loc = pos; 
| 
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protected Position< Entry<K,V>> location ) ( 


return loc; 
} 


protected Position<Entny <K,V >> setLocation(Position--Entry =K. W> > pos) 1 
Position<Entry=K,V>= oldPosition = location ); 


loc = pos; 


return oldPosition; 


| 
protected K selKey[K key) I 
К oldKey = getKey |; 


k = key; 
return oldkey; 


protected Y setValue(v value) { 
V oldValue = getValue |; 


у = value; 


return old Value; 


| 
| 


Trecho de código 8.18 Uma fila de prioridades adaptável implementada com uma sequência 
ordenada armazenando localizadores. (Continuação do Trecho de código 8.17.) A classe ani- 
nhada LocationAwareEntry implementa um localizador e estende a classe aninhada MyEntry da 
SortedListPriorityQueve apresentada no Trecho de código 8.6. 


8.5 Exercícios 


Para obter o código fonte e auxilio com os exercícios, visite java.datastructures.net. 


Reforço 
R-&.I 


K-5.2 


R-8.3 


R-8.4 


Suponha que você chame cada nodo v da árvore binária T com uma chave 
igual ao nivel anterior de v. Sobre que circonstância T é um heap? 

Qual é a saída da seguinte seqiiéncia de métodos do TAD fila de priorida- 
des: insert(5.4), insert dB). insen(7, inserti |J, removeMin(), insert( 3,4). 
inserti, L) removeMind), removeMin( ). insert(8 Cr, removeMin(). inserti? T), 
removeMin| ), removeMin( ү? 


Um aeroporto está desenvolvendo uma simulação de controle de tráfego 

aéreo que trata eventos como decolagens e pousos. Cada evento tem um 

time-stamp que registra à hora em que o evento acontece, O programa de 

simulação deve realizar eticientemente as duas operações fundamentais a 

seguir: 

ж inserir um evento com um dado time-stamp (ou seja, inserir um evento 
futuro): 

e extrair o evento com menor time-stamp (ou seja, determinar à próximo 
evento a processar]: 

* que estrutura de dados você usaria para suportar estas operações? Justi- 
hque sua resposta, 

Embora seja correto usar um comparador "reverso" com o TAD fila de 

prioridade para recuperar e remover elementos com a maior chave a cada 


К-8.5 


R-8.6 


R-8.7 


R-8.8 
R-8.9 


R-8.10 


R-5.11 


R-8.12 


R-8.13 


R-8.14 


R-b.15 


R-8.16 


R-8.17 


R-8.18 


Fila de Prioridade 325 


operação, é um pouco confuso que um elemento com a maior chave seja 
retornado por um método chamado "removeMin". Escreva uma pequena 
classe adaptadora que recebe uma fila de prioridade P e um compara- 
dor associado C. e implementa uma fila de prioridade que opera com os 
elementos que têm a maior chave através de métodos com nomes como 
removeMax. 

Ilustre a execução do algoritmo selection-sort sobre os seguintes dados de 
entrada: (22, 15, 36, 44, 10, 3, 9, 13, 29, 25]. 

lustre a execução do algoritmo insertion-sort sobre os dados do exercício 
anterior, 

Forneca um exemplo de sequência de pior caso com m elementos para o inser- 
tion-sort e mostre como ele é executado em tempo £M ) nesta sequéncia, 


Onde pode estar armazenado o elemento com a mator chave em um heap? 
Na definição da relação “a esquerda de" para dois nodos de uma árvore 
binária (Seção 8.3.1) pode-se usar um caminhamento prefixado em vez de 
um caminhamento interfixado? E com um caminhamento pós-fixado? 


Ilustre a execução do algoritmo heap-sort sobre os seguintes dados de en- 
trada: [2, 5, 16, 4, 10, 23, 39, 18, 26, 15]. 


Sendo T uma árvore binária completa em que v armazena a entrada (piv), 
onde piv) é o número do nível de v. À árvore Té um heap? Justifique sua 
resposta. 
Explique por que não se considera o caso do filho direito de r ser interno e 
o filho esquerdo ser externo quando se descreve o processo do down-heap 
bubhling. 


Existe um heap T armazenando 7 elementos diferentes de forma que um 
caminhamento prefixado de T apresente os elementos de Tem ordem eres- 
cente ou decrescente? E se for um caminhamento interfixado? E pós-fixa- 
do? Se sim, apresente um exemplo, caso contrário justifique. 

Considere Н um heap que armazena 15 elementos usando uma represen- 
tação de arranjo de uma árvore binária completa. Qual é a seqüéncia de 
indices do arranjo que é visitado no caminhamento prefixado de A7? E qual 
é a sequência em um caminhamento interfixado? E em um caminhamento 
pús-fixado? 

Mostre que a soma 


y log i, 
iel 


que aparece na análise do heap-sort, é Ihn log т). 

Bill afirma que um caminhamento prefixado em um heap não listará as cha- 
ves em ordem decrescente. Apresente um exemplo de um heap que prove 
que ele está errado, 

Hillary afirma que um caminhamento pós-fixado em um heap não listará as 
chaves em ordem crescente, Apresente um exemplo de um heap que prove 
que ela está errada. 


Apresente todos os passos do algoritmo para remover a chave 16 do heap 
da Figura 8.3. 
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C-3.10 
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Assumindo que a entrada para o problema de ordenação é dada em um ar- 
rango A, apresente como implementar o algoritmo de insertion-sort usando 
somente o arranjo À e, no máximo, mais seis variáveis. 

Descreva como implementar o algoritmo heap-sort usando, no máximo, 
seis variáveis inteiras em acréscimo a um arranjo de entrada. 

Descreva a sequência de n inserções em um heap que requer o tempo [Kir 
log n) para processar. 

Um método alternativo para encontrar o último nodo durante uma inserção 
em um heap T é armazenar no último nodo e em cada nodo externo de T 
uma referência para o nodo externo imediatamente à sua direita ("dando 
a volta" para o primeiro nodo no próximo nível no caso do nodo mais à 
direita). Mostre como manter essas referências em tempo O(1) por ope- 
ração do TAD fila de prioridade assumindo que T é implementado como 
estrutura encadeada, 

Descreva uma implementação completa de uma árvore binária completa Y 
que utiliza uma estrutura encadeada e referencia o último nodo. Em parti- 
cular, apresente como alterar a referência do último nodo através das ope- 
rações add e remove no tempo O(log m), onde n é o número atual de nodos 
de Т. Tenha certeza de tratar todos os casos possíveis, como ilustrado na 
Figura 8.12. 


u 


(bi 


Figura 8.12 Alteração do último nodo em uma árvore binária completa após a operação add ou 
remove, O nodo w é o último nodo antes da operação add ou após a operação remove, O nodo г 
ёо último nodo após a operação add ou anterior a operação remove. 


C-8.13 


C-8.14 


Representa-se um caminho da raiz até um dado nodo de uma árvore binária 
através de uma string binária em que O significa “siga para o filho à esquer- 
da" e 1 significa “siga para o filho à direita”. Por exemplo, o caminho da 
raiz at o nodo armazenando (8, W0 no heap da Figura 8.122 é representado 
pela string 101. Proponha um algoritmo de tempo logarítmico para encon- 
trar o último nodo de uma árvore binária completa com m nodos, bascado 
na representação apresentada. Mostre como este algoritmo pode ser usado 
em uma implementação de uma árvore binária completa utilizando uma 
estrutura encadeada que não mantém a referência para o último nodo. 

Dado o heap Te a chave X, apresente um algoritmo para computar todas as 
entradas de T com chave menor ou igual a chave k. Por exemplo, dado o 
heap da Figura 8.12a e o filtro k = 7, o algoritmo deverá reportar as entra- 
das com as chaves 2, 4, 5, 6 e 7 (mas nào necessariamente nesta ordem), 
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9.1 


O tipo abstrato de dados mapa 


Um mapa permite armazenar elementos que podem ser localizados rapidamente usando chaves. 
A motivação para cada pesquisa é que cada elemento armazena informações adicionais que são 
úteis junto com a chave, mas somente pode ser acessada através da chave. Especificamente, um 
mapa armazena um par chave-valor (kv), chamado de entradas, onde & é a chave e v é o valor 
correspondente. Além disso, o TAD mapa requer que cada chave seja única, e a associação da 
chave com o valor define um mapeamento. Para conseguir o maior nível de generalização, per- 
mite-se que as chaves e os valores possam armazenar qualquer tipo de objeto. (Ver Figura 9.1.) 
Em um mapa que armazena registro de estudantes (como o nome do estudante, endereço e suas 
notas), a chave pode ser o número do identificador (1D) do estudante. Em algumas aplicações, a 
chave e o p valor podem ser o mesmo. Por exemplo, possuindo-se um mapa que armazena núme- 
ros primos cada número poderia ser usado como chave e como valor. 


жааай 


valor 


Figura 9.1 Uma ilustração conceitual do TAD mapa. As chaves (rótulos) são definidas para vwa- 
lores (disquetes) por um usuário. As entradas resultantes (disquetes com rótulos) são inseridas em 
um mapa (fichário) As chaves podem ser usadas, mais tarde, para reaver ou remover os valores, 


Em ambos os casos, usa-se a chave como um identificador único que é definido por uma 
aplicação ou usuário para um objeto valor associado. Assim, um mapa é mais apropriado em 
situações em que cada chave é para ser vista como um índice único para seu valor, ou seja, um 
objeto que serve como um tipo de localização para um determinado valor. Por exemplo, para 
armazenar informações de estudantes, provavelmente se precisaria usar o TD do estudante como 
chave (e não permitir que dois estudantes tenham o mesmo identificador). Em outras palavras, à 
chave associada com um objeto pode ser vista como um “endereço” para um objeto, Certamente, 
mapas são algumas vezes referidos como um armazenamento associativo, porque a chave asso- 
ciada com um determinado objeto determina sua “localização” na estrutura de dados. 


O TAD mapa 


Visto que um mapa armazena uma coleção de objetos, ele deve ser visto como uma coleção de 
pares chave-valor, Como um TAD, um mapa M suporta os seguintes métodos: 
size(): Retorna o número de entradas de M; 
isEmpty(): Testa se M está vazio; 
getik): Se M contém uma entrada e com chave igual a £, então retorna o valor 
de e, senão retorna null. 
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putik e): se M não tem uma entrada com chave igual а k então adiciona a entri- 
da (kv) em M retorna null; senão, substitui com v o valor existente na 
entrada com chave & e retorna o valor antigo; 
remove(kr remove a entrada de M com chave igual à К, e retoma seu valor; se M 
não possui a entrada com chave & então retorna null; 
keys(): retorna uma coleção contendo todas as chaves armazenadas em M 
(keys J.iterator( ) retoma um iterator das chaves): 


values(): retorna uma coleção contendo todos os valores associados com as cha- 
ves armazenadas em M (values ).iterator() retorna um iterator dos va- 
lores 


entries(): retorna uma coleção contendo todas as entradas (chave-valor) de M 
(entries!) iterator[) retorna um пега das entradas). 


Quando os métodos gatik). put(&.v) e remove(k) são executados em um mapa M que não 
possui entrada com chave igual a £, usa-se a convenção de retornar null. Um valor especial como 
este é conhecido como sentinela (veja Seção 3.3). A desvantagem do uso do null como sentinela 
é que esta escolha pode criar ambigüidade em que precisaria-se de uma entrada (К, null) com o 
valor null no mapa. Claro que outra escolha seria lançar uma exceção quando alguém solicita 
uma chave que não está no nosso mapa. 1550 provavelmente não seria um uso apropriado de 
uma exceção. Entretanto, é normal questionar por algo que pode não estar no mapa. Além disso, 
lançar e capturar uma exceção é tipicamente mais lento que um teste de um sentinela; portanto, 
o uso do sentinela é mais eficiente (e, neste caso, conceitualmente mais apropriado)». null é usado 
como um sentinela para um valor associado com uma chave não existente, 


Exemplo 9.1 Na seguinte tabela, mostra-se o efeito de uma sério de operações em um mapa 
inicialmente vazio que armazena chaves inteiras e valores com um nico caractere, 


isEmpty() ü | 
put(5, A} null HSAN | 
puti 7,8) null (C5, AD. CT. 81} 
put(2,0) null 105,4), (7, Ду, (2, C)] 
putí &, D) null CS, AMT, 85,(2,C), (8, D] | 
put( 2, E) E [(65,A 07, B), (2, E), (3, DI} 
geti 7) B {5.4),(7, В), (2, EY,(08,)] 
getí4) null (05, A), CT, By, (2, E), (8, D] 
getí 2) E [(5,A4), C7, B), C2, E, (8, D] 
size) 4 (65.AY, (7, B), (2, E), (8, DH] 
removal ^) А H7, Ву, (2, ENGE, DI} 
removet 2) E (7,B).(8,D)) 
geti 2) null LO. BY OL D] 
isEmptyl ) false IO, B, (8, 2} 


Mapas no pacote java.util 

O pacote Java java.util inclui uma interface para o TAD mapa, o qual é chamada java.util.Map. 
Esta interface é definida para que uma implementação de uma classe force chaves únicas e 
inclua todos os métodos de um TAD mapa apresentados abaixo, exceto para alguns casos com 
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o uso de nomes diferentes. A correspondencia entre o TAD mapa e a interface java.util.Map € 
apresentada na Tabela 9.1. 


Métodos da TAD mapa 


Métodos da interface java.util.Map 


size ) size) 
isEmptyt ) isEmpty() 

| get (k) get(k) 

| putik, v) putik, v) 
remove (K) remove (K) 
keys) keySet() 
valuesi | values ( ) 


entries | entrySet( ) 
Tabela 9.1 Correspondência entre os métodos do TAD mapa е os métodos da interface java.util. 
Map. o qual suporta também outros métodos. 


9.1.1 Uma implementação simples de mapa 


Uma simples forma de implementar um mapa é armazenar suas n entradas em uma sequência 5, 
implementada como uma lista duplamente encadeada. A execução dos métodos fundamentais, 
getik}, put(k.v) e remove(k), envolve busca simples sobre 5 procurando por uma entrada com 
chave k Apresenta-se o pseudo-código da execução destes métodos em um mapa M no Trecho 
de código 9.1. 

Esta implementação do mapa baseada em sequência é simples, mas ela somente é eficiente 
para mapas realmente pequenos. Cada um dos métodos fundamentais leva o tempo EXT) em um 
тара com п entradas, porque cada método pesquisará, no pior caso, em toda a sequência Assim, 
algo mais rápido seria preferido. 


Algoritmo getik): 
Entrada: uma chave k 
Saídas O valor para chave k em M, ou nulo se não existir uma chave К em M 
рага cada posição p em 5.positions( ) faça 
se p.element( J.getKey() = k então 
retorna p.element( | getvalue( ) 
retorna nulo [Não existe elemento com chave igual a A] 
Algoritmo put(k,v): 
Entrada: um par chave-valor (kv) 
Saida: O antigo valor associado com a chave £ em M ou nulo se & é uma nova chave, 
para cada posição em $. positions) faça 
se p.element( ).getKey() ^ k então 
te p.element( J.getValue( ) 
E setip (Evy 
retorna ѓ [retorna o valor antigo] 
5.addL ast((k vy) 
nenti (incrementa a variável que armazena o número de elementos | 
retorna nulo [Não existia elemento anterior com chave igual a k] 
Algoritmo removedk): 
Entrada: uma chave & 
Saida: O valor (removido) para a chave k em M, ou nulo se É não estiver em M 
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Para cada posição p em S.positions( ) faça 
Se p.element( ).getKey( ) = k então 
t «— p.element( ).getValue( ) 
5.remaovet n) 
тє п 1 [decrementa a variável que armazena o número de elementos ] 
Retorna г [retorna o valor removido] 
Retorna null [nào existe elemento com chave igual a É) 


Trecho de código 9.1 Algoritmos para os métodos fundamentais do mapa com uma sequência 5. 


9.2 Tabelas de hash 


As chaves associadas com elementos em um dicionário são fregtientemente consideradas como 
“endereços” dos elementos. Exemplos desse tipo de aplicações são as tabelas de símbolos de um 
compilador ou as listas de variáveis de ambiente em um sistema operacional, Em ambos os casos, 
essas estruturas consistem em uma coleção de nomes simbólicos na qual cada nome serve de 
“endereço” para propriedades sobre o tipo de uma variável ou seu valor. Uma das manciras mais 
eficientes de implementar um dicionário em tais circunstâncias é usando uma tabela de hash. 
Embora. como será visto, o tempo de execução de pior caso das operações do TAD dicionário 
seja An) quando se usa uma tabela de hash, uma tabela dessas pode realizar essas operações em 
tempo esperado O(1). Em geral, uma tabela de hash consiste em dois componentes principais, 
um arranjo de buckeis e uma função de hash. 


9.2.1 Arranjo de buckets 


Um arranjo de buckets para uma tabela de hash é um arranjo A de tamanho №, em que cada cé- 
lula de A é considerada como um "bucket" (ou seja, um contéiner para pares chave-elemento), е 
o inteiro № determina à capacidade do arranjo. Se as chaves forem inteiros bem distribuidos no 
intervalo [О.А — 1]. esse arranjo de buckets é tudo o que é necessário, Um elemento e com chave 
k é simplesmente inserido no bucket A[X]. (Ver Figura 9.2.) Para economizar espaço, um arranjo 
de buckets vazio pode ser substituído por um objeto null. 


0 1 2 з 4 5 6 т в о 10 
pi E ат, NS NEED. NEN: ар. HEN UNE. 
(1,10) 13.0} б^)! 17,0} 
(3,Fi 16,0) 
CRE 


Figura 9.2 Um arranjo de buckets de tamanho 11 para as entradas (1,2), (3,0), (3, F}, 
CABANA OS e COLOR. 


Se nossas chaves são inteiros únicos no intervalo [0,N — 1], então cada bucket armazenará 
no máximo uma entrada. Assim, pesquisas, inserções e remoções em um arranjo de buckets levä- 
rá o tempo (41), Parece ser um grande resultado, mas tem duas desvantagens. Primeiro, o espaço 
utilizado é proporcional a №, Dessa forma, se N é muito maior que o número de entradas п real- 
mente presentes no dicionário, será um desperdicio de espaço, A segunda desvantagem é que é 
exigido que as chaves sejam inteiras no intervalo [0, N — 1], o que freqüentemente não acontece. 
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Pelo motivo destas duas desvantagens, usa-se o arranjo de buckets em conjunto com um “bom” 
mapeamento das chaves para inteiros no intervalo [0, N — 1]. 


Funções de hash 


A segunda parte de uma tabela de hash é uma função, À, chamada de função de hash, que mapeia 
cada chave k em um inteiro no intervalo [0,N — 1]. onde N é a capacidade do arranjo de buckets para 
essa tabela. Com uma função de hash A deste tipo, pode-se aplicar o método do arranjo de buckets 
para chaves arbitrárias. А idéia central desta abordagem é usar o valor da função de hash, hik), como 
um indice no arranjo de buckets A, em vez da chave & (que é provavelmente inadequada para uso 
como Índice de um arranjo de buckets). Ou seja, o item (Ee) é armazenado no bucket АГА]. 

Claro, se existirem duas ou mais chaves com o mesmo valor de hash, então dois diferentes 
elementos serão mapeados para o mesmo bucket em A. Neste caso, diz-se que uma colisão ocor- 
reu. Claramente, se cada bucket de A pode armazenar somente um elemento, então não se pode 
associar mais de um elemento com um simples bucket, o qual é um problema de casos de coli- 
ses. Para não se ter dúvidas, existem formas de tratar as colisões, as quais serão discutidas de- 
pois, mas a melhor estratégia é tentar evitá-las em um primeiro momento. Diz-se que uma função 
de hash é “boa” se o mapeamento das chaves no dicionário minimiza colisões o máximo possível, 
Por razões práticas, se gostaria que uma função de hash seja rápida e fácil de computar. 

Seguindo a convenção do Java, visualiza-se a evolução de uma função de hash, hik), consis- 
tindo de duas ações — mapeamento da chave k para um inteiro, chamado de código do hash, е o 
mapeamento do código do hash para um inteiro em um intervalo de índices ([0, № = 1]) de um 
arranjo de buckets chamado função de compressão. (Ver Figura 9.3.) 


Objetos arbitrários 


código de hash 


A ia ro rr o d 


função de compressão 


6060000040000 
012 = N-1 


Figura 9.3 As duas partes de uma função de hash: um código de hash е uma função de 
compressão. 


9.2.3 


Códigos de hash 


A primeira ação que uma função de hash realiza é tomar uma chave arbitrária k no dicionário e 
atribuir a ela um valor inteiro. O inteiro associado a uma chave k é chamado de código hash ou 
valor de hash para К, Este inteiro não precisa estar no intervalo [0, N — 1] e pode mesmo ser 
negativo, mas se deseja que o conjunto de códigos hash associados às chaves reduza as colisões 
tanto quanto possível. Além disso, para ser consistente com todas as chaves, o código hash que se 
usa para uma chave К deve ser igual ao código hash de qualquer chave igual a É. 
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Códigos hash em Java 


A classe genérica Object definida em Java é equipada com um método padrão hashCodel ) para 
mapear as instâncias de um objeto em um inteiro que é a “representação” do objeto. Especifi- 
camente, o método hashCode ) retorna um inteiro do tipo int de 32 bits. A não ser que seja čs- 
pecificamente sobrescrito, esse método é herdado por cada objeto usado em um programa Java. 
No entanto, deve-se ter cuidado ao usar a versão padrão de hashCodel }, pots esta pode ser uma 
interpretação inteira da posição do objeto па memória (como é o caso em muitas implementações 
em Java). Este tipo de código não funciona bem com cadeias de caracteres, por exemplo, porque 
duas cadeias de caracteres em locais diferentes da memória poderiam ter o mesmo conteúdo e, 
neste caso, se desejaria que elas tivessem o mesmo código. De fato, a classe Java String fornece 
outro método hashCode( ), mais apropriado para cadeias de caracteres. Da mesma forma, dese- 
jando-se usar determinados objetos como chaves de um dicionário, deve-se fornecer um método 
hashCode() para esses objetos, fornecendo um mapeamento que associa inteiros bem distribui- 
dos aos objetos. 

Serão analisados então vários tipos de dados comuns € alguns exemplos de métodos asso- 
ciando códigos hash a esses tipos de dados. 


Conversão para inteiros 


Para iniciar, nota-se que para qualquer tipo de dado X representado com no máximo tantos bits 
quanto nosso código hash inteiro, pode-se simplesmente usar como código de hash para X uma 
interpretação inteira de seus bits. Assim, para os tipos Java byte, short, inte char, pode-se obter 
um bom código hash simplesmente convertendo este tipo para int. Da mesma forma, para uma 
rartável x do tipo float, converte-se x para um inteiro com uma chamada para floatTolntBits(x), e 
usa-se este inteiro como código hash para x, 


Somando componentes 


Para tipos como lang c double, cuja representação em bits é duas vezes maior do que um código 
de hash, a idéia acima não pode ser aplicada diretamente. Ainda assim, um código hash possível 
e usado por mulas implementações em Java é simplesmente converter a representação de um 
long para um inteiro do tamanho do código de hash. Este código de hash, naturalmente, ignora 
metade da informação presente no valor original, e se muitas das chaves em nosso dicionário 
diferem apenas na outra metade, então elas colidirão através deste algoritmo simples. Um código 
de hash alternativo, que leva todos os bits em consideração, é obtido somando-se a representação 
inteira dos bits de mais alta ordem € a representação inteira dos bits de mais baixa ordem. Esse 
código de hash pode ser descrito em Java como segue: 
static int hashCodellong i) [return (ий >> 32) + (int) 1):) 


De fato, a alternativa baseada na soma de componentes pode ser estendida a qualquer objeto 
x cuja representação binária possa ser vista como uma k-tupla (XXX) de inteiros, pois 
pode-se formar um código de hash para x como $n X, Por exemplo, tendo-se um número de 
ponto Flutuante, soma-se sua mantissa е seu expoente como inteiros longos e então aplicar um 
código hash para inteiros longos para o resultado. 


Códigos hash polinomiais 


O código hash baseado em somas descrito acima não é uma boa escolha para caderas de carac- 
teres ou outros objetos longos que podem ser vistos como tuplas da forma (tt ,...£, q) onde 
a ordem dos elementos x, é relevante, Por exemplo, considere um código hash para uma cadeia 
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de caracteres х que soma os valores ASCII (ou Unicode) dos caracteres em s. Este código hash 
infelizmente produz muitas colisões indesejáveis para cadeias de caracteres bastante comuns. 
Em particular, "tempü1* e *temp10* colidem com esta função, e também colidem as palavras 
"stop", "pots", spot" € "tops", Um código de hash melhor deveria levar em conta a posi- 
ção dos elementos w, Uma alternativa que faz exatamente isso é escolher uma constante a > De 
diferente de 1, e usar como código de hash o valor dado por 


1 2 
sa +х to A H A 


Matematicamente falando, é simplesmente um polinômio em a que usa os componentes 
[X eX piro СОЮ seus coeficientes, Este código hash é conhecido, portanto como código hash 
polinomial, Pela regra de Horner (veja o Exercício C-4.11). pode ser escrito como; 


xi Flagg T Gin + s all + a, + ax, ee ЈА 


intuitivamente, um código hash polinomial usa a multiplicação pela constante a como uma 
forma de “dar espaço” a cada componente em uma tupla de valores e ainda preserva a caracteri- 
zação dos componentes anteriores. 

Claro que, em um computador típico, a avaliação de um polinômio será feita com precisão 
finita e periodicamente o valor acumulado irá causar overflow no espaço usado para armazenar 
um inteiro. Já que se está interessado no espalhamento do código de hash em relação às chaves, 
pode-se simplesmente ignorar este overflow. Ainda assim, deve-se lembrar que esse tipo de over- 
flow é possível e escolher uma constante a que tenha alguns bits de baixa ordem diferentes de 
zero, o que servirá para preservar um pouco da informação mesmo em caso de overflow, 

Foram feitos alguns estudos experimentais que sugerem que 33, 37, 39 e dl são valores 
particularmente bons para a quando as cadeias de caracteres а serem armazenadas são palavras 
da lingua inglesa. De fato, em uma lista de mais de 50.000 palavras em inglés, formada por meio 
da união de listas de palavras fornecidas em duas versões de Unix, constatou-se que escolhendo 
а = 33, 37, 39 ou 41 produz menos de 7 colisões em cada caso! Não deve ser uma surpresa, 
portanto, descobrir que várias versões de Java escolhem uma função de hash polinomial baseada 
em uma dessas constantes. Para obter maior velocidade, no entanto, algumas implementações em 
Java somente aplicam a função de hash polinomial em uma fração dos caracteres de cadeias de 
caracteres muito longas. 


Códigos hash com shift 


Uma variação dos códigos hash polinomiais substitui a multiplicação por a por um shift do 
resultado parcial, Uma função assim, aplicada a cadeias de caracteres em Java, poderia ser a 
seguinte: 


static int hashCode(String s) 4 
int h= 0; 
for (int i=0; i s.length( Y; i+ +} { 
h= h<< 5) |f === 27% 4 shift de cinco bits na soma atual 
h += (int) s.charAt(); //somar novo caracter 


] 
return h; 


Assim como o código hash polinomial, usar o código hash baseado em shift requer ajustes. 
Neste caso, deve-se escolher com cuidado a quantidade de bits a deslocar para cada caractere. 
Mostra-se na Tabela 9.2 os resultados de alguns experimentos em uma lista de pouco mais de 25 
mil palavras em inglés, na qual se compara o número de colisões para deslocamentos diferentes. 
Esses experimentos, bem como os anteriores, mostram que se a constante a ou o deslocamento 
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а distribuição dos valores. De fato, se N não for primo, então existe uma maior probabilidade 
de que padrões na distribuição das chaves sejam repetidos na distribuição dos códigos de hash, 
causando colisões. Por exemplo, tendo-se as chaves (200, 205, 210, 215, 220,..., 600] em um 
arranjo de buckets de tamanho 100, então cada código hash irá colidir com três outros. Se esse 
mesmo conjunto de chaves for colocado em um arranjo de buckets de tamanho 101, no entanto, 
não haverá colisões. Se uma função de hash for bem escolhida, ela deve garantir que a probabili- 
dade de duas chaves diferentes irem para à mesma posição no arranjo de buckets é de no máximo 
UN. Escolher N como um número primo, no entanto, não é sempre suficiente, pois se há um pa- 
drão repetitivo de chaves com o formato pN + q para vários valores diferentes de p, então ainda 
ocorrerão colisões. 


O método MAD 


Uma função de compressão mais sofisticada, que ajuda a eliminar padrões repetitivos em um 
conjunto de chaves inteiras, € o método de multiplicação, adição e divisão (ou “MAD”), Este 
método mapeia um inteiro i para 


lai + b| mod N, 


onde N é um número primo, e a > O (chamado de fator de ativação*) e b = O (chamado shift) 
são constantes inteiras escolhidos aleatoriamente quando a função de compressão foi determi- 
nada, de forma que a mod N + 0. Esta função de compressão é escolhida de forma a eliminar 
padrões repetidos no conjunto de códigos de hash e a conduzir mais perto de uma “boa” função 
de hash, ou seja, uma função em que a probabilidade de colisão de duas chaves seja no máximo 
UN. Este comportamento seria o mesmo que se teria se as chaves fossem “jogadas” em A de 
forma aleatória e uniforme. 

Com uma função de compressão como esta, que espalha n inteiros de forma bastante homo- 
gênea no intervalo [0, № — 1]. e com um mapeamento das chaves em nosso dicionário para os 
números inteiros, tem-se uma função de hash efetiva. Juntos, uma função assim e um arranjo de 
buckets definem os componentes essenciais de uma implementação baseada em tabela de hash 
para o TAD dicionário. 

Antes de detalhar de como realizar operações como put, get e remove, deve-se primeiro 
resolver o problema do tratamento de colisões. 


9.2.5 Esquema para tratamento de colisões 


А idéia principal de uma tabela de hash é tomar um arranjo de buckets А e uma função de hash A 
e usá-los para implementar um dicionário, armazenando cada item (k,v) em um "bucket" AAC]. 
Esta idéia simples é tornada complicada, no entanto, quando se tem duas chaves distintas, ke ky 
tais que Ik.) = hik). A existência desta colisão impede que se faça imediatamente a inserção do 
novo item (kr) na posição A[h(k)]. Ela também complica as operações getik), putik) e removelk). 


Encadeamento separado 


Uma maneira simples e eficiente de lidar com colisões é fazer com que cada posição Ali] arma- 
zene uma referência para um pequeno dicionário, W, implementado utilizando uma seqüéncia, 
como descrito na Seção 9.1.1, contendo itens (k.v) tais que hik) = i. Isto é, cada encadeamento 
separado M. juntamente com os elementos que possuem índice г em uma lista encadeada. Esta 


* M, de R. T, O autor utilizou o termo scaling factor 
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regra para a resolução de colisões é conhecida como encadeamento separado. Assumindo que 
inicializa-se cada "bucket" Ali] para ser um dicionário baseado em seqliéncia vazio, pode-se 
facilmente usar a regra do encadeamento separado para executar as operações fundamentais do 
mapa. como mostrado no Trecho de código 9.2. 


Algoritmo get £y 
Saída: O valor associado com a chave £ em um mapa, ou nulo se não existir elemento com 
chave igual à k nó mapa. 
retorna A[/&)].get(k) [delega a busca (get) para o mapa baseado em lista АЛЕ] | 
Algoritmo putik r)i: 
Saida: Se existir um elemento no nosso mapa com chave igual a k então se retorna seu vä- 
lor (alterando ele com c caso contrário retorna-se nulo. 
te A[RCEY]. putik.) [delega a inserção (put) no mapa bascado em lista com A[A(k)]] 
se т = nulo então [K e uma nova chave) 
Het + 1 
retorna f 
Algoritmo removeri): 
Saída: О valor (removido) associado com a chave É no mapa. ou nulo se não existir ele- 
mento com chave igual a k no mapa. 
t+ ААС remove) [delega a remoção (remove) para mapa baseado em lista AJA(k)]] 
se + nulo então [E foi encontrado] 
nt no] 
retorna г 


Trecho de código 9.2 Métodos fundamentais do TAD mapa, implementada com uma tabela de 
hash que usa encadeamento separado para resolver colisões entre n elementos. 


Para cada uma das operações fundamentais de dicionários envolvendo uma chave É, dele- 
pa-se o tratamento desta operação ao dicionário miniatura baseado em seguência e armazenado 
em АТАС). Assim, риб) percorrerá esta sequência procurando por um elemento com chave 
igual a К; se encontrar, substitui o valor existente por v; caso contrário, insere (Ку) no final desta 
sequência. Da mesma forma, getik) pesquisará nesta sequência até chegar ao final da mesma ou 
encontrar um elemento com chave igual a k. Eo remove(&) executará uma pesquisa similar, mas 
adicionando a remoção de um elemento após encontrá-lo. Pode-se “escapar” com esta simples 
abordagem baseada em sequência, porque a propriedade de propagação de uma função de hash 
ajuda a manter cada pequena sequência de “buckets”. De fato, uma boa função de hash tenta 
minimizar colisões tanto quanto possível, o que implica que a maior parte dos buckets estarão 
vazios ou contendo apenas um elemento. Essa observação permite fazer uma pequena mudança 
na implementação de forma que se um "bucket" А[ está vario, ele armazenará null, e se Ali] 
armazena um único elemento (E,v), pode-se simplificar tendo Ali] apontando diretamente para o 
elemento {kv} de preferência рага um dicionário baseado em sequência armazenando somente 
um elemento. Os detalhes desta otimização de espaço como um exercício (C-9.5). Na Figura 9.4, 
ilustra-se uma tabela de hash com encadeamento separado. 

Assumindo que se está usando uma boa função de hash para colocar nossos n itens de nosso 
dicionário em um arranjo de buckets de tamanho №, espera-se que o número de elementos asso- 
ciados a cada posição seja n/N. Este valor, que é chamado de fator de carga da tabela de hash 
te marcado com À), deveria portanto ser limitado por uma pequena constante, preferencialmente 
menor do que 1. Portanto, dada uma boa função de hash, o tempo de execução esperado das 
operações gel, put e remove em um dicionário implementado com uma tabela de hash que usa 
esta função É OL ul). Assim, implementam-se estas operações para executarem em um tempo 
esperado de O1), sabendo-se que n é ON). 


Hidden page 


Hidden page 


344 Estruturas de Dados e Algoritmos em Java 


ser implementado, desde que nossa estratégia de teste minimize a possibilidade de formação de 
agrupamentos decorrente do endereçamento aberto, 


926 Uma implementação Java para tabelas de hash 


Nos Trechos de códigos 9.3-9,5, mostra-se a classe HashTableMap que implementa um TAD 
dictonário usando uma tabela de hash com teste linear para resolver colisões. Estes trechos de 
códigos incluem toda a implementação do TAD dicionário, exceto para os métodos values ) e 
entries), os quais são deixados como exercicio (R-9, 10), 

Os principais elementos de projeto da classe Java HashTableMap são apresentados a seguir: 


Mantém-se, em variáveis de instâncias, o tamanho, n, do dicionário, o arranjo de buckets, 

A, са capacidade, М, de A. 

Usa-se o método hashValue para computar a função hash de uma chave através do méto- 

do hashCode implementado e da função de compressão multiplicação-adição-e-divisão 

(MAD. 

Define-se uma sentinela, AVAILABLE, como um marcador de itens desativados. 

Prové-se um construtor opcional que permite especificar a capacidade inicial do arranjo 

de huckets. 

Sc o arranjo de buckets atual estiver cheio € alguém tenta inserir um novo elemente, re- 

processam-se todos os elementos em um novo arranjo que possui um tamanho duas vezes 

superior a versão antiga. 

Os seguintes métodos auxiliares (protegidos) são utilizados: 

a checkKey(£), que verifica se a chave k é válida. Este método atualmente verifica que 
k não é null, mas a classe que estende HashTableMap pode sobrescrever este método 
com um teste mais elaborado, 

© rehash(), que computa uma nova função hash MAD com parámetros randómicos e 
reprocessa os elementos em um novo arranjo com o dobro de capacidade. 
findEntry( К}, que procura por um elemento com a chave igual a £, iniciando pelo indice 
ADAK] e percorre o arranjo em uma forma circular. Se o método encontra uma posi- 
ção com um elemento, então retorna o Índice i desta posição. De outra forma, retorna 
—i— l, onde i é o índice da última posição vazia ou disponível encontrada. 


¿2% Lima tabela de Hash com teste linear e a função de hash MAD */ 
import java util Iterator; 
public class HashTableMap - K,V-- implements Мар= KV > { 
public static class HashEntry-— K,V — implements Entry= KV -— 1 
protected K key; 
protected V value; 
public HashEntry{K К, V vi { key = ki value = yi } 
public V getValue) 1 return value; | 
public К getK ey ) { return key; | 
public V setValue(V val | 


V aldValue = value; 
value — val; 
return old'valua: 


public boolean equalsiObject о) | 


HashEntry= K,V > ent; 

try [ent = (HashEntry=: KN} o; ) 

catch (ClassCastException ex) ( return false; | 

return (ent. getkeyt ) == key] && (eant. get Value | == value} 
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) 


protected Entry -K,V-— AVAILABLE = new | HashEntry-=K, V (null, null): 4º marcador 
protected int n = 0; ¿número de elementos no dicionário 
protected int capacity; V capacidade do arranjo de bucket 
protected Entry <K,V>[] bucket; “arranjo de bucket 
protected int scale, shift; // shift e fator de ativação 
/** Cria uma tabela de hash com capacidade inicial 1023, */ 
public HashTableMap() ( this(1023); ) 
/** Cria uma tabela de hash com uma capacidade informada. */ 
public HashTableMaptint cap) | 
capacity = cap: 
bucket = (Entry <K,V=[ | new Entry(capacity]; // Cast seguro 
java.util. Random rand = new java.util Random |; 
scale = rand.nextinticapacity— 1) + 1; 
shitt = rand.nextinticapacityl 
| 
/** Determina se uma chave е válida. */ 
protected void checkKeytK kj [ 
if (К == null) throw new InvalidKeyException("Chave inválida: null."X 


} 
“** Função de hash aplicando o método MAD para o hash code padrão. */ 
public int hash Value(K key] [ 
return Math.abs(key.hashCode( )*scale + shift) % capacity; 
} 


Trecho de código 9.3 Classe HashTablaMap implementando um TAD dicionário, usando uma 
tabela de hash com teste linear. (Continua no Trecho de código 9.4.) 


Pet Retoma o número de elementos da tabela de hash. */ 
public int size( | [ return n; | 
/** Verifica e retorna verdadeiro caso a tabela esteja vazia, */ 
public boolean isEmptyl ) | return in Ok: } 
Pet REtorna um objeto contendo todas as chaves. */ 
public Iterable<K > keys ) | 
PositionList - К keys = new NodePositionL ist К =) 
for (int i-0; i<capacity; I+ +) 
if ([bucket[i] != null) && (шске [| != AVAILABLE 
keys. addLast(bucketli] getKeyr |): 
return keys; 
| 
/** Método de pesquisa auxiliar - retorna o indice da chave encontrada ou —(a +1) onde a е 
= p indice da primeira posição vazia ou livre encontrada. */ 
protected int findEntry/k key) throws invalidKeyException 1 
int аман 1; 
checkKey[key); 
inti = hashValue(key): 
intj = i; 
do [ 
Entry<=KV> e = buckat[i]; 
if ( & == null) f 
if (avail = 0) 
avail =i; S chave não esta na tabela 
break; 
} 


AA E om one n —Ó— —s ——M— 2 


If (key.equals(e.qetkKey( ji) FA chave ё encontrada 
return i; if chave encontrada 
if (e == AVAILABLE) | // bucket está desativado 
if (avail — 0) 
avail = i; // lembre que esta posição está livre 
} 
¡a (i + 1) % capacity; 4 keep looking 
} while (i != |); 
return — (avail + 1); H Primeira posição vazia ou livre 
} 
Per Retorna o valor associado com a chave. */ 
public V get (К key) throws InvalidKeyException | 
inti = findEntry(key); —//método auxiliary para encontrar aa chave 
if (i < 0) return null; if Não existe valor para esta chave 
return bucket[i].getValue( ); // retorna o valor encontrado neste caso 
| 
Trecho de código 9.4 Classe HashTableMap implementando um TAD dicionário, usando uma 
tabela de hash com teste linear. (Continua no Trecho de código 9.5.) 


/** insere um par chave-valor no mapa, substituindo o anterior, se existir. */ 
public V put (К key, V value) throws InvalidKeyException { 
inti = findEntrylkey) //Encontra o espaço apropriado para este elemento 
i(i == 0) // Esta chave tem um valor. 
return ((HashEntry--K, V) bucket[i]).setValue(value); // define o novo valor 
if (n >= capacity/2) { 
rehash(); // rehash para manter o fator de carga <= 0,5 
i = findEntry(kay); // Encontra novamente o local apropriado para este elemento 
| 
bucket[ -i— 1] = new HashEntry =K, V (key, value); // converte para o indice próprio 
++; 
return null; // Não existia valor antigo 
} 
/** Duplica o tamanho da tabela de hash e rehash todos os elementos. */ 
protected void rehash() ( 
capacity = 2*capacity, 
Entry<K,V>[] old = bucket; 
bucket = (Entry <K,V>[ || new Entry[capacity]: // о novo bucket é duas vezes maior 
java.util Random rand = new java. util. Random |); 
scale = rand.nextinticapacity=— 1) + 1; if novo fator de ativação para o hash 
shift = rand.nextinticapacity); /f novo fator de deslocamento para o hash 
for (int i=0; i-old.length; i++) { 
Entry-- К.М e = оја; 
if ((е != null) && (е l= AVAILABLE) ( ff um elemento válido 
Int | = — 1 — findEntry(e.getKey(); 
биске = е; 
} 
} 
} 


/** Remove o par chave-valor com uma específica chave. */ 
public Y remove (К key) throws InvalidKeyException { 
inti-findEntrykey; “encontra primeiro а chave 
if (i| = 0) return null; nada para remover 
V toReturn = bucket[i].getValue( |; 


Hidden page 


348 Estruturas de Dados e Algoritmos em Java 


9.2.8 Aplicação: contador de frequência de palavras 


Como uma mimatura de estudo de caso usando tabela de hash, considere-se o problema de con- 
tagem do número de ocorrências de diferentes palavras em um documento, as quais aparecem, 
por exemplo, quando estudiosos de discursos políticos procuram por temas, Uma tabela de hash 
é uma estrutura de dados ideal para o uso neste problema, por podermos usar palavras como cha- 
ves, e contadores de palavras como valores. À aplicação será mostrada no Trecho de código 9.6. 


import java.io.*; 
import java.util. Scanner; 
import net.datastructures.*; 
{*® Lim programa que conta palavras em um documento, imprimindo a mais frequente. */ 
public class WordCount | 
public static void main(String[ | args) throws Exception | 
Scanner doc = new Scanner System. irh 
doc.useDelimiter(^ [*a-zA-2] "7 ignora caracteres que não são letras 
HashTableMap --String.Integer-- A = new HashTableMap= String, Integer |; 
String word; 
Intager count, 
while (doc hasNext()) { 
word = doc.next |: 
if (word.equals(*")) continue;  // ignora strings nulas entre delimitadores 
word = word.toLowerCase(); ignora se maiúscula e minúscula 


count = hgetiword); ff pega o contador anterior e conta com esta palavra 
if {count == nulli 

h.putlword, 1}, H autoboxing allows this 
else 


h.putiword, «county; // autoboxing/unboxing allows this 
} 
int maxGount = 0; 
String maxWord = "sem palavras"; 
for (Entry = String, Integer> ent: h.entries[ |) [ // procura o número máximo de palavras 
if (ent.getValue( ) > maxCount) { 
maxWord = егі. дее ); 
maxCount = ant.getValuei y; 


} 
System out print("A palavra mais freglüente & Wi = +maxWord); 
oystem.out.println(",S" com um total de ocorrências = " + maxCoum +", 


| 
| 


Trecho de código 9.6 Um programa para contar frequências de palavras em um documento, 
apresentando às palavras mais frequentes. O documento é analisado usando a classe Scanner, 
pelo qual se altera o delimitador de tokens de espaço em branco para qualquer símbolo que não 
seja letra. Convertem-se, também, as palavras para minúsculo, 


9.3 ОТАР dicionário 


Como um mapa, um dicionário armazena pares chave-valor (kv). es quais são chamados de gele- 
mentos, onde k é a chave e v é o valor. Similarmente, um dicionário permite que chaves e valores 
sejam de qualquer tipo. Mas, apesar de que um mapa insiste que elementos devam ter chaves 
únicas, um dicionário permite que múltiplos elementos possam ter a mesma chave, bastante pare- 
cido com um dicionário de inglês, o qual oferece múltiplas definições para uma mesma palavra. 


Hidden page 


350 


Estruturas de Dados e Algoritmos em Java 


9.3.1 


FN. de 


Dicionários baseados em sequências e auditorias 


Uma simples forma de realizar um dicionário é utilizar uma sequência não-ordenada para arma- 
zenar os elementos chave-valor. Esta implementação é frequentemente chamada arquivo de log 
vu auditoria? ^s primeiras aplicações de auditoria são situações em que se deseja armazenar па 
estrutura de dados, Por exemplo, muitas operações do sistema armazenam arquivos de log para 
requisições de autenticação processadas. O cenário típico é aquele que possui muitas inserções 
no dicionário e algumas pesquisas, Por exemplo, pesquisas por operações em um arquivo de log 
tipicamente ocorrem após algumas coisas de errado terem ocorrido. Assim, um dicionário baseado 
em sequência suporta inserções simples € rápidas, possivelmente o gasto do tempo de pesquisa, 
pelo armazenamento dos elementos em um dicionário com ordem arbitrária. (Ver Figura 9.6.) 


A próxima inserção seria no final 


Figura 9.6 Realização de um dicionário O utilizando um arquivo de log. Somente as chaves 
deste dicionário são mostradas para apresentar a implementação da sequência näo-ordenada. 


Implementando um dicionário com uma sequência nào-ordenada 


Assume-se que a sequência 5, usada para um dicionário baseado em sequência, é implementada com 
uma lista duplamente encadeada. Apresentam-se as descrições dos principais métodos do dicionário 
para uma implementação baseada em sequência no Trecho de código 9.7. Nesta simples implemen- 
tação, não se assume que um elemento armazena uma referência para sua localização em 5. 


Algoritmo indad: 
Entrada: Uma chave k 
Saída: Uma coleção de elementos com chave igual a & 
Cria uma sequência L inicialmente vazia 
para cada elemento e em D.entriesi ) faça 
se cgetkeyi) = É então 
E addLastie) 
retorna ¿L 105 elementos em Eso os elementos selecionados | 
Algoritmo inserti. 
Entrada: uma chave ke valor y: 
Saida: o elemento (£,v adicionado em D 
Cria um novo elemento e = (£a 
Chama S.addLastie) [5 está desordenado | 
retorna e 
Algoritmo removet e. 
Entrada: Um elemento e 
Saida: O elemento removido e ou nulo se e nào estiver em D 


RT. O amor utiliza a expressao ande rec. 
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{Não se assume agui que e armazena sua localização em $) 
рага cada posição p de 5.positions() faça 
se p.element( | = e então 
Chama S.remove(p) 
retorna e 
retorna nulo [nào existe elemento e em D] 
Algoritmo entries): 
Entrada: Nenhuma 
Saida: Uma coleção dos itens do dicionário D 
retorna 5 Los elementos de $ são os itens de D] 


Trecho de código 9.7 Alguns dos principais métodos para um dicionário D, implementado 
com uma sequência não-ordenada 5. 


Análise de um dicionário baseado em sequência 


Será analisado, resumidamente, o desempenho de um dicionário implementado com uma sequiéncia 
não-ordenada. Iniciando com o uso da memória, nota-se que o espaço requerido por um dicionário 
baseado em seqüéncia com n elementos é Chr), visto que a estrutura de dados de lista encadeada tem 
o uso de memória proporcional ao seu tamanho. Adicionalmente, com esta implementação de um 
TAD dicionário, pode-se realizar fácil e eficientemente a operação insertík y) com uma simples chia- 
mada ao método addLast de 5, o qual simplesmente adiciona o novo elemento no final da sequência. 
Assim. alcança-se o tempo O1) para executar a operação insert kv) no dicionário D. 

Infelizmente, essa implementação não permite uma execução eficiente do método findik). 
Uma operação findik) requer. no pior caso, à varredura de toda a sequência 5, examinando cada 
um dos n elementos. Por exemplo, é possível usar um iterator nas posições de $, parando sempre 
que se encontra um elemento com chave igual a k (ou alcançar o final da sequência). O pior caso 
para o tempo de execução deste método ocorre quando o elemento procurado não está na seqúén- 
cia, e, portanto, percorre todos os м elementos da sequência. Assim, o método find é executado 
em tempo Om). 

De forma similar, o tempo proporcional para n é necessário no pior caso da execução da 
operação removeie) em À, assumindo-se que os elementos não mantém o endereço das suas pu- 
sições em S. Assim, o tempo de execução para execução do método remove(e) é On), De forma 
alternativa, usando-se elementos que conheçam os endereços em que armazenam suas posições 
em 5, então se pode executar a operação removeteno tempo O1). (Ver Seção 9.5.1.) 

A operação findAll sempre requer que se procure em toda a sequência $, e, portanto, seu tenm- 
po de execução é Om). Mais precisamente, usando a notação “bie-Thera” (Seção 4.2.3), diz-se 
que a operação findAll executa o tempo En), visto que tem-se o tempo proporcional para a no 
melhor e no pior caso, Ou seja, elas são executadas em tempo linear, tanto em seu melhor quanto 
em cu pk KT CANLI. 

Concluindo, implementar um dicionário com uma sequência não-ordenada provê inserções 
rápidas, mas ao custo de pesquisas e remoções lentas, Assim, só se deve usar esta implementação 
quando se espera que o dicionário sempre seja pequeno ou quando o número de inserções seja 
grande se comparado com pesquisas e remoções. É claro, arquivar transações de bases de dados 
ou de om sistema operacional são situações com essas características. 

Apesar disso, existem muitos outros cenários em que o número de inserções em um dicio- 
nário é proporcional ao número de pesquisas e remogóes, e, nesses casos, a implementação com 
uma sequência é claramente inapropriada. A implementação de um dicionário não-ordenado, que 
se discutirá em seguida, pode frequentemente ser usada para que se tenham inserções, гетен 
e procuras rápidas em muitos casos. 
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9.3.2 Implementação de um dicionário com tabela de hash 


Pode-se usar uma tabela de hash para implementar um TAD dicionário, quase da mesma for- 
ma que se fez para o TAD mapa. É claro que a principal diferença é que o dicionário permite 
elementos com chaves duplicadas. Assumindo que o fator de carga da nossa tabela de hash é 
mantido abaixo de 1, a função de hash espalha elementos uniformemente de forma correta, e se 
usa encadeamento separado para resolver colisões, de forma que se pode alcançar o tempo QU) 
no desempenho dos métodos find, remove e insert e o tempo Oil + m) no desempenho para o 
método finda, onde i é o número de elementos retornados, 

Adicionalmente, podem-se simplificar os algoritmos para à implementação deste dicionário, 
assumindo-se que se tem um dicionário baseado em sequência, armazenando elementos em cada 
posição de um arranjo de buckets A. Tal suposição, estaria em conformidade com o nosso uso de 
encadeamento separado, desde que cada célula fosse uma seqüència. Esta abordagem permite, 
implementar os principais métodos do dicionário, como é mostrado no Trecho de código 9.8. 


Algoritmo inserti, uv): 
Entrada: uma chave k e valor v 
Saida: O elemento (kv) adicionado em D 
sein + 1)/N-- À então 
Dobre o tamanho de A e rehash todos os elemineos existentes. 
e €— A[h(K)]insert(k,v) 
men + | 
retorna e 
Algoritmo findAllK) 
Entrada: uma chave k 
Saida: Uma coleção de elementos com chave igual a É 
retorna A [Л] finda) 
Algoritmo remove(e): 
Entrada: um elemento e 
Saida: O elemento removido e ou nulo se e não estiver em D 
te Alhik)].remoweie) 
se t + nulo então 
пж п =] 
retorna i 


Trecho de código 9.8 Alguns dos principais métodos para um dicionário D, implementados 
com uma tabela de hash que usa um arranjo de buckets, A, e uma sequência não-ordenada para 
cada posição em A. Usa-se n para denotar o número de elementos em D, N para denotar a capa- 
cidade de A, e À para denotar o maior fator de carga para a tabela de hash, 


9.3.3 Tabelas de pesquisa ordenada e pesquisa binária 


5e as chaves em um dicionário D estão ordenadas, podem-se armazenar 04 elementos de D em 
um arranjo 5 em ordem não-crescente de chave. (Ver Figura 9.7.) Especifica-se que 5 é um arran- 
jo, mais particularmente, uma sequência de elementos, pois a ordenação das chaves no vetor 5 
permite uma pesquisa mais rápida do que seria possível se 5 fosse, por exemplo, uma lista enca- 
deada. Reconhecidamente, uma tabela de hash possui uma boa expectativa do tempo de execução 
de pesquisas. Porém, seu pior tempo de pesquisa não é melhor que em uma lista encadeada, e em 
algumas aplicações, como em um processamento de tempo real, é necessário garantir um limite 
para o pror caso. O algoritmo rápido para pesquisa em um arranjo ordenado, o qual se discute 
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nesta subsegäo, tem garantidamente o melhor tempo de execução para o pior casa. Ele pode ser o 
preterido para uma tabela de hash em certas aplicações. Faz-se referência a esta implementação 
do arranjo ordenado de um dicionário D como uma tabela de pesquisa ordenada. 


o | 2 3 d 5 fi 7 K u 10 
Figura 9.7 Realização de um dicionário por uma tabela de pesquisa ordenada, Mostram-se 
somente às chaves deste dicionário para destacar sua ordenação. 


O espaço requerido por uma tabela de pesquisa ordenada € Ota), o qual é similar a imple- 
mentação do dicionário baseado em sequência (Seção 9.3.1), assumindo que se expande e retrai 
o arranjo suportando a seqiiéncia 5 para manter o tamanho proporcional deste arranjo com à 
número de elementos de 5. Entretanto, diferente de uma sequência não-ordenada a execução de 
alterações em uma tabela de pesquisa leva uma quantidade de tempo considerável. Em particular, 
a execução da operação insen(k,v) em uma tabela de pesquisa requer o tempo de Oz), desde que 
seja necessário deslocar todos os elementos do arranjo com chave maior que & para fazer espaço 
para o novo elemento (4,4) Uma observação similar se aplica para а operação remove(&), visto 
que ele leva o tempo On) para deslocar todos os elementos do arranjo com chave maior que É 
pará fechar o “buraco” deixado pelo elemento removido (ou elementos), A implementação da 
tabela de pesquisa é, por esta razão, inferior ao arquivo de fog em termos dos tempos de execução 
по pior caso das operações de atualização do dicionário, Apesar disso, podemos executar o mé- 
todo find mais rápido em uma tabela de pesquisa. 

Pesquisa binária 

Uma vantagem significativa do uso de um arranjo ordenado 5 para implementar um dicionário D 
com n elementos é que o acesso a um elemento de 5 pelo seu índice custa o tempo CN I). É precisa 
lembrar que o índice de um elemento em uma seqüéncia é o número do elemento anterior (Seção 
6.1). Assim, o primeiro elemento de 5 tem o indice U, e o último elemento tem o indice n — 1. 

Os elementos em 5 são os itens do dicionário D, e já que $ está ordenado, o item com co- 
locação à tem uma chave que não é menor do que as chaves dos itens com colocações O, 1,..., 
i — l, e não maior do que as chaves dos itens com colocações г + |... a 1. Esta observa- 
ção permite que se ache um item usando um método de procura muito rápido, Chama-se de 
candidato um item de D se, no estágio atual de procura, não se pode garantir que a chave seja 
igual a É. O algoritmo mantém dois parámetros, low e high. tais que todos os itens candidatos 
tenham colocação maior ou igual a low e menor ou igual a high. Inicialmente, tem-se low = 


De high = — 1. Então, se compara & à chave do candidato mediano, ou seja, o item com 
colocação 


mid = | (low + highy2 1 

Analisa-se três casos: 

+ Sek = e.getKey(), então se acha o item que se estava procurando, e a pesquisa termina 
com sucesso, retornando e. 

. Sek — e getKey(), então se reexamina a primeira metade do vetor, ou seja, a metade com 
colocações entre low e mid — 1. 

+ Se k e getKeyl ), então se reexamina a segunda metade do vetor, ou seja, a metade com 
colocações entre mid + | € high. 
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(mid=1)-low+1= [erre |. WR a” акаа, 


3 < 
ou 

high = (mid + 1) +1=high- [emen < € 2" el i 

Inicialmente, o número de itens candidatos é n; após a primeira chamada a BinarySearch, cle 

é de no máximo n/2; após a segunda, ele é de no máximo n/4, e assim sucessivamente. Em geral, 

após a i-ésima chamada a BinarySearch, o número de candidatos restantes é de no máximo 1/2. No 


pior caso (o elemento não existe), as chamadas recursivas param quando não há mais itens candida- 
tos. Portanto, o número máximo de chamadas recursivas feitas é o menor inteiro m tal que 


n/2" < |. 


Em outras palavras (e lembrando que a base de um logaritmo é omitida quando é 2), m > 
log n. Assim, tem-se 


m=Logn]+ 1, 


o que implica que a pesquisa binária é executada no tempo log n). 

Existe uma variação simples da pesquisa binária que realiza findAll(&) em tempo (lag rm + sh, 
onde x é o número de elementos retomados. Os detalhes são deixados como um exercício (C-9.4). 

Portanto, pode-se usar uma tabela de pesquisa ordenada para pesquisas rápidas em um dicio- 
nário, mas usar uma tabela de pesquisa ordenada para muitas atualizações do dicionário tomaria 
um tempo considerável, Por essa razão, a aplicação primária para uma tabela de pesquisa deve 
ser executada em uma situação em que se esperam poucas atualizações no dicionário, mas muitas 
pesquisas. Uma situação assim surgiria, por exemplo, em uma lista ordenada das palavras usadas 
para ordenar uma enciclopédia ou arquivo de ajuda. 


Comparando implementações de dicionário 


A Tabela 9.3 compara os tempos de execução dos métodos de um dicionário realizado por uma 
sequência não-ordenada, uma tabela de hash ou uma tabela de pesquisa ordenada. Nota-se que 
uma sequência não-ordenada permite inserções rápidas, mas pesquisas e remoções lentas, en- 
quanto a tabela de pesquisa permite pesquisas rápidas, mas inserções e remoções lentas. Embora 
não se tenha discutido o assunto explicitamente, nota-se que uma sequência ordenada imple- 
mentada com uma lista duplamente encadeada seria lenta em quase todas as operações de um 
dicionário. (Ver Exercício R-9.3.) 


AA 


| size, isEmpty | Ol | aM ol) 
Olm) 
пади 
insert 
ON) exp., О(п) pior caso 


Tabela 9.3 Comparação dos tempos de execução dos métodos de um dicionário realizado atra- 
vês de uma sequência não-ordenada, uma tabela de hash ou uma tabela de pesquisa ordenada. 
Indica-se n como o número de itens no dicionário, N como sendo a capacidade do arranjo de 


Hidden page 


Hidden page 


Hidden page 


Mapas e Dicionários 359 


finalmente uma moeda dê cara. Em seguida, ligam-se todas as referências ao novo item (k, v), 
criadas neste processo, para criar a torre para o novo elemento. Uma “jogada de moeda” pode 
ser simulada com a classe java.util Random, que é um gerador randômico de números criado em 
Java, chamando o método nextint(2), o qual retorna O ou |, cada um com probabilidade de 50%, 

Fornece-se o algoritmo de inserção para uma skip list 5 no Trecho de código 9.11, e ilustra- 
se este algoritmo na Figura 9.11. О algoritmo de inserção usa uma operação insertAHerAbove(p 
JL, v) que insere uma posição armazenando o item (Къ) após a posição р (no mesmo nível de 
p) e acima da posição q, retornando a posição r do novo item (e acertando as referências internas 
para que os métodos next, prev, above e below funcionem corretamente para p, q e r), O tempo 
de execução esperado do algoritmo de inserção em uma skip list com л elementos é O(log m). o 
qual se mostra na Seção 2.4.2. 


Algoritmo Skiplnsert(k,v) 


Entrada: Chave ke valor v 
Saída: Elemento inserido na skip list 
p + SkipSearch(k) 
q = insertAfterAbove(r. null, (£, vi) [está-se no nivel inferior] 
ғ «— c. elementi ) 
¡0 
enquanto coinFlip() = heads Faça 
iet + 1 
sei = h então 
h «—h + I [adicionar um novo elemento na skip list] 
t 4— nextis) 


х  insertáfterAbovel nulo, s. ( — oc, nulo?) 
insertAfter&bowvels, г, {+ оо, nuloj) 
enquanto abovelp) = nulo faça 


p previp) | varredura | 
p + above(p) [ir para o nivel mais alto] 
q — insertAfterAbove(p.g,e) [adicionar uma posição na torre do novo elemento] 
nent 1 
retorna e 


Trecho de código 9.11 Inserção em uma skip list. O método coinFlip( | retorna “cara” ou “co- 
гоа”, cada uma com probabilidade de 509%. As variáveis n, he s armazenam o número dos ele- 
mentos, a altura e o nodo inicial da skip list. 
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Figura 9.11 Inserção de um elemento com chave 42 na skip list da Figura 9.9. Assume-se 
que a “jogada da moeda” randômica para o novo elemento retornará à coroas seguidas em uma 
linha, seguido pela cara. Às posições visitadas estão marcadas em cinza. À posição inserida para 
armazenar o novo elemento está desenhada com linhas grossas, € as posições precedentes estão 
marcadas com bandeiras. 
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Remoção em uma skip list 


Como os algoritmos de pesquisa é inserção, o algoritmo de remoção para uma skip list 5 é bastante 
simples. De fato, ele é ainda mais simples do que o algoritmo de inserção. Isto €, para realizar uma 
operação removeí£), começa-se pela execução do método SkipSearchik). Se a posição p armazena 
um elemento com chave diferente de К, então retorna null. Caso contrário, remove-se p e todas 
as posições acima de p, as quais são facilmente acessadas usando a operação above para subir na 
torre deste elemento em $, iniciando na posição p. O algoritmo de remoção é ilustrado na Figura 
9.12, е sua descrição detalhada é deixada como um exercício (R-9. 16). Como será mostrado na 
próxima subseção, o tempo de execução esperado para remoção em uma skip list é log m). 

Antes de descrever a análise, no entanto, existem alguns melhoramentos para a estrutura de 
dados skip list que devem ser discutidos. Primeiro, não se precisa realmente armazenar referên- 
cias para os itens da skip list acima do nivel base, pois o que é necessário nestes níveis são as Te- 
feréncias para as chaves. Segundo, não se precisa realmente do método above. Na verdade, nem 
se necessita do método prev. Pode-se realizar a inserção e remoção de itens de cima para baixo 
haseando-as em varreduras е economizando referências para os elementos anteriores e acima 
de um elemento. Us detalhes dessa otimização serão explorados no Exercício C-9.10. Nenhuma 
dessas otimizações melhora o desempenho assintótico das skip lists por mais do que um fator 
constante, mas ainda assim esses melhoramentos podem ser importantes na prática, De fato, ex- 
perimentos sugerem que as skip lists otimizadas são mais rápidas, na prática, do que árvores AVL 
e outras árvores balanceadas de pesquisa, que são discutidas no Capítulo 10, 

O tempo de execução esperado para o algoritmo de remoção é O(log a). o que será mostrado 
na Seção 9,42, 


Figura 9.12 Remoção do elemento com chave 25 da skip list da Figura 9.11. As posições vi- 
sitadas após a pesquisa pela posição $, guardando o tem são demarcados em cinza, As posições 
removidas são desenhadas com linhas tracejadas. 


Mantendo o nivel superior 


Uma skip list 5 deve manter uma referência para a posição inicial (o elemento mais acima ё à 
esquerda em $) como uma variável instanciada, e deve-se ter uma política para tratar qualquer 
inserção que queira continuar inserindo um item acima do nivel superior de S. Existem duas pos- 
sjveis opções neste caso, е as duas tëm seus méritos, 

Uma possibilidade é restringir o nivel superior, fr, para mantê-lo em algum valor fixo que 
seja função de i o número de itens atuais no dicionário (veremos pela análise que A = max{ 10,2 
[og n | | é uma boa escolha e que 4 = 3 | log n | é ainda mais seguro.) Implementar esta opção 
significa que se deve modificar o algoritmo de inserção para que ele termine quando se atingir o 
nivel mais alto (a não ser que [log n | < [logía + 11], pois, neste caso, pode-se subir ainda mais 
um nível, uma vez que o limite de altura estará crescendo). 

A outra possibilidade é deixar a inserção continuar inserindo o elemento enquanto a moeda 
lançada pelo gerador de números aleatórios der coroa, Esta abordagem usa o Algoritmo Skipinsert 


Hidden page 
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Por exemplo, se м = 1000, esta probabilidade é uma em um milhão. Generalizando, dada 
uma constante c > 1, А ё maior do que c log n com probabilidade no máximo 1/n" '. Ou seja, a 
probabilidade de que A seja menor ou igual a c log n é no mínimo I = I/n' '. Assim, com uma 
alta probabilidade, a altura A de Fé log п). 


Analisando o tempo de pesquisa em uma skip list 


Considere-se o tempo de execução de uma pesquisa em uma skip list 5, lembrando que uma pes- 
quisa envolve dois laços while aninhados. O lago interno realiza a varredura em um nivel de 5 en- 
quanto a próxima chave não for maior do que a chave & sendo procurada, e o laço externo desce 
para o nível inferior e repete а varredura. Como a altura h de 5 é O(log n), com grande probabili- 
dade, o número de passos de descida nos níveis é O(log n), também com grande probabilidade. 

Ainda temos de limitar o número de passos de varredura que se fez. Seja п, o número de 
chaves examinadas quando se está fazendo uma varredura no nivel i, Observe-se que, depois da 
chave na posição inicial, cada chave adicional examinada em uma varredura no nível i nào pode 
pertencer ao nível ¿+ 1, pois a teríamos encontrado na varredura anterior. Assim, a probabilidade 
de que uma chave seja contada em n, é 1/2, Portanto, o valor esperado de a, é igual ao número 
esperado de vezes em que se deve jogar uma moeda antes que cla dé cara. Esse valor esperado 
é 2, Assim, o total de tempo esperado que será gasto em varreduras em qualquer nível é Ol). 
Como 5 tem log a) níveis com grande probabilidade, uma pesquisa em 5 toma um tempo es- 
perado Ойор n). Com uma análise similar, pode-se mostrar que o tempo de execução esperado 
para inserção e remoção é ilog n). 


Espaço utilizado em uma skip list 


Finalmente, examinaremos a exigência de espaço de uma skip list 5 com a elementos. Como se 
se observa acima, o número de itens esperado no nível (€ n/2, significando que o número total de 
elementos esperados em 5 é 


Usando a Proposição 4.5 de soma geométrica, tem-se: 


й ү 
1 ( Е sje? para todo h 20. 
q 


Portanto, a exigência de memória esperada para 5 é Oda). 
A Tabela 9,4 resume o desempenho de um dicionário realizado com uma skip list. 


, insert, remove 


Ооп) (esperado) 
аА! | Otlogn s) (esperado) | 


Tabela 9.4 Desempenho de um dicionário realizado com uma skip list. Denota-se o número 
de itens no dicionário no momento da operação com a, e o tamanho do iterador retornado pelas 
operações findAll com s. À exigência de memória esperada é An). 
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9.5 Extensões e aplicações de dicionários 


Nesta seção, exploram-se várias extensões e aplicações de dicionários. 


9.5.1 Suportando localizadores em um dicionário 


Como foi feito com as filas de prioridades (Seção 8.4.2), pode-se também usar localizadores para 
acelerar o tempo de execução de algumas operações em um dicionário. Em particular, um loca- 
lizador pode acelerar muito a remoção de um elemento em um dicionário. Para remoção de um 
localizador e, pode-se simplesmente ir diretamente ao local na estrutura de dados em que e está 
armazenado e removê-lo, Seria possível implementar um localizador, por exemplo, pela adição a 
nossa classe de i, a variável privada location e métodos protegidos location) e setLocation pj. o 
qual retorna e define esta variável respectivamente. Então, se requer que a variável location para 
um elemento e sempre referenciará a posição de e ou o indice na estrutura de dados da implemen- 
tação do dicionário. Seria necessário alterar esta variável toda vez que o elemento fosse movido, 
assim, provavelmente faria mais sentido que esta classe fosse mais relacionada com a classe que 
implementa o dicionário (a classe localizador poderia ser aninhada na classe dicionário). Abai- 
xo, se mostrará como definir localizadores para diversas estruturas de dados apresentadas neste 
capítulo. 


+ Següencia náo-ordenada: em uma sequência não-ordenada L, implementando um dicio- 
nário, é possível manter a variável location de cada elemento e para apontar para a posição 
de e em uma lista encadeada suportada por L. Esta escolha permite executar o método 
remove(e) como £L.remove(e.location( )), o qual executaria no tempo C I). 

+ Tabela de hash com encadeamento separado: considere uma labela de hash, com um 
arranjo de buckets A e uma função de hash A, que usa encadeamento separado para tratar 
colisões. Usa-se a variável location de cada elemento e para apontar para à posição de e na 
sequência L implementando um mini-mapa A[h(k)]. Esta escolha permite executar o prin- 
cipal trabalho de um método remove e) como Lremove(e location( |}, o qual executaria 
em um esperado tempo constante. 

e Tabela de pesquisa ordenada: em uma tabela ordenada T, implementando um dicionário, 
se manteria a variável location de cada elemento e para ser o índice de e em T. Esta esco- 
Ша permitiria executar o método remove(e) como T.remove(e Jocation( |). (Relembrando 
que location() agora retorna um inteiro.) Esta abordagem executaria de forma rápida se o 
elemento e estiver armazenado próximo do fim de T. 

* Skip list: Em uma skip list 5 implementando um dicionário, se manteria a variável lo- 
cation de cada elemento e para apontar à posição de e no nível base de 5. Esta escolha 
permitia saltar o passo da pesquisa em nosso algoritmo para executar o método remove e) 
em uma skip list. 


Apresenta-se o resumo do desempenho da remoção de um elemento em um dicionário com 
localizadores na Tabela 9,5, 


Sequência | Tabela de hash | Tabela de pesquisa 


OCT) (experado) Ollogn) (experado) 


Tabela 9.5 Desempenho do método remove em dicionário implementados com localizadores, 
Usa-se 4 para denotar o número de elementos em um dicionário. 
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9.5.2 


O TAD dicionário ordenado 


Em um dicionário ordenado, precisa-se executar as operações comuns dos dicionários, mas tam- 
bém manter uma relação de ordem para as chaves do nosso dicionário. Pode-se usar um com- 
parador para prover a relação de ordem entre as chaves, como se fez para as implementações 
de dicionários, tabela de pesquisa ordenada e skip list descritas anteriormente. De fato, todas as 
implementações de dicionários discutidas no Capítulo 10 usam um comparador para armazenar 
o dicionário em ordem não-decrescente de chave. 

Quando os elementos do dicionário são armazenados em ordem, pode-se prover implemen- 
tações eficientes de métodos adicionais em um TAD dicionário. Por exemplo, poderia-se consi- 
derar a adição dos seguintes métodos no TAD dicionário, bem como definir no TAD dicionário 
ordenado. 


first}: Retorna um elemento com a menor chave. 
last): Retorna um elemento com a maior chave. 


successors: Retorna um iterator dos elementos com chaves maiores ou iguais а k, 
em ordem nào-decrescente. 


predecessors(ky Retorna um iterator dos elementos com chaves menores ou iguais а К, 
Em order näo-crescenke. 


implementando um dicionário ordenado 


A ordem natural das operações acima torna o use de uma seguência não-ordenada ou uma tabela 
de hash inapropriada para implementar o dicionário, pois nenhuma destas estruturas de dados 
mantém qualquer informação de ordenação para as chaves do dicionário. De fato, tabelas de hash 
alcançam seus melhores desempenhos de pesquisa quando suas chaves estão distribuídas quase 
que randomicamente. Assim, se deveria considerar uma tabela de pesquisa ordenada ou skip list 
(ou uma estrutura de dados do Capítulo 10) quando da distribuição com dicionários ordenados. 

Por exemplo, usando uma skip list para implementar um dicionário ordenado, pode-se im- 
plementar os métodos firsti } e lasti ) no tempo CMI) acessando à segunda e a penúltima po- 
sição da sequência de base. Também os métodos successors(k) e predecessors(k) podem ser 
implementados para executar no tempo CN log м). Além disso, o iterator retornado pelos métodos 
successors(k) e predecessors(k) poderiam ser implementados usando uma referência para а 
posição atual do nivel base da skip list. Assim, os métodos hasNext e next destes iteradores exe- 
cutariam cada Lum EIN um tempo constante usando esta abordage In. 


A interface java.util.SortedMap 


Java provê uma versão ordenada para a interface java util Map chamada java util SortedMap. Esta 
interface estende a interface java.util.Map com métodos que recebem ordem na contas. Como a 
interface pai, uma SortedMap não pemite chaves duplicadas. 

lenorando o fato de que dicionários permitem múltiplos elementos com a mesma chave, 
possíveis correspondências entre métodos do nosso TAD dicionário ordenado e os métodos da 
interface java util. SortedMap são apresentados na Tabela 9.6. 


9.5.3 


Banco de dados de vóos e conjuntos máximos 
Como mencionado nas seções anteriores, dicionários não-ordenados e ordenados têm muitas 
aplicações. 

Resta seção, serão exploradas algumas aplicações específicas de dicionários ordenados. 


Mapas e Dicionários 365 
Métodos do dicionário ordenado | Métodos da interface java.util SortedMap | 

first( ).getKey( ) firstKeyl ) 
first ( ).getValue() get(firstKey( }) 


lasti . getKey() lastKeyi } 
last( ).getWaluei ) get(lastKeylt }) 
successors (А) tailMap( E) .entrySet ( ).iterator( ) 
predecessors ik) headMap( E) .entrySet ( ).iterator( ) 


Tabela 9.6 Livre correspondencia entre métodos do TAD dicionário ordenado € métodos da in- 
terface java.util.SortedMap, o qual suporta outros métodos, A expressão java.util.SortedMap para 
predecessorsi(k) não é, entretanto, exatamente uma correspondéncia como o iterador retornado 
seria pela ordenação crescente das chaves, e não incluiria o elemento com chave igual a k. Parece 
não ser uma eficiente forma de pegar a correspondência verdadeira para predecessors(k) usando 
os métodos da java util. SortedMap. 


Banco de dados de vôos 


Existem vários sites da Web que permitem aos usuários executar pesquisas em banco de dados 
de vôos para encontrar vóos entre várias cidades, tipicamente com a intenção de vender uma 
passagem. Para criar a pesquisa, um usuário especifica a cidade de origem e de destino, uma data 
da partida e hora da partida. Para suportar essas pesquisas, pode-se modelar o banco de dados de 
vãos como um dicionário, onde as chaves são objetos Flight que contem campos correspondentes 
aos seus quatro parâmetros. Isto é, a chave é uma rupla 


k = (origem, destino, data, hora). 


Informações adicionais, como o número do vão, o número de assentos vagos na primeira 
classe (F) e na classe económica (Y), duração do vão e valor da passagem, podem ser armazena- 
das em um objeto valor. 

Entretanto, encontrar à vão requisitado não é simplesmente encontrar uma chave em um 
dicionário com a pesquisa correspondente. À principal dificuldade é que, embora um usuário 
precise encontrar exatamente as cidades de origem e destino, bem como a data de partida, ele 
provavelmente estará satisfeito com qualquer hora de partida que estiver próxima da hora de par- 
tida informada, É claro que se pode gerenciar cada pesquisa por meio da ordenação das chaves 
usando o léxico. Assim, dada uma chave de pesquisa do usuário É, pode-se invocar o método 
successors(k) para retornar um conjunto de todos os vôos entre as cidades desejadas na data de 
partida informada, com hora de partida ordenada de forma crescente a partir da hora de partida 
informada. Um uso similar do método predecessors(k) daria vôos com horas de partidas an- 
teriores à hora de partida informada, Então, uma implementação eficiente para um dicionário 
ordenado, como um que usa uma skip list, seria uma boa forma para satisfazer cada pesquisa. 
Por exemplo, chamando o método successors(k) com uma chave de pesquisa £ = (ORD, PWD, 
O5Maio, 09:30), resultaria em um conjunto com os seguintes elementos: 

UORD, Рур, 05Maio, 09:53), (AA 1840, F5, Y15, 02:05, $251)) 

HORD, РМО, 05Maio, 13:29), (AA 600, F2, YO, 02:16, 5713) } 

HORD, PYD. 05Maio, 17:39), (АА 416, ЕЗ, ҮЭ, 02:09, 3365) ) 

(ORD, PVD, 05Maio, 19:50), (АА 1828, F9, Y25, 02:13, $186) ) 


Conjunto máximo 


А vida é cheia de trocas, Freglientemente, é necessário trocar um desejo de avaliar o desempenho 
em oposição a um custo correspondente. Supõe-se para o propósito de um exemplo, que estamos 
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interessados na manutenção de um banco de dados de classificação de automóveis pela veloci- 
dade máxima e pelo custo. Seria desejável permitir a alguém, com uma certa quantia para gastar, 
pesquisar ná nossa base de dados a fim de procurar pelo carro mais rápido que esteja dentro das 
suas possibilidades. 

Pode-se modelar um problema de comercialização como este pelo uso de um par chave-valor 
para modelar os dois parâmetros que se está comercializando, os quais, neste caso, seriam o par 
(custo, velocidade) para cada carro. Note-se que usando esta medida alguns carros são estrita- 
mente melhores que outros. Por exemplo, um carro com o par custo-velocidade (20.000- 100) 
é estritamente melhor que o carro com o par custo-velocidade (30.000-90). Ao mesmo tempo, 
existem carros que não são sobrepujados por outro carro. Por exemplo, um carro com o par cus- 
to-velocidade (20.000- 100) pode ser melhor ou pior que um carro com o par custo-velocidade 
(30.000- 120), dependendo de quanto dinheiro se possui para gastar (Ver Figura 9.13.) 


Desempenho 


Custo 


Figura 9.13  llustracáo do custo-desempenho das trocas com pares chave-valor representados 
por pontos no plano. Note-se que o ponto p é estritamente melhor que os pontos c, d € e, mas 
pode ser melhor ou pior que os pontos a, b, f. g e h, dependendo do preço que se deseja pagar. 
Assim, se adicionando o ponto p no nosso conjunto, poderia-se remover os pontos c, d e e, mas 
não os outros. 


Formalmente, diz-se que um par prego-desempenho (a,b) domina um par (cad) se a < c 
e b > d. Um par (a,b) é chamado par máximo se este não é dominado por nenhum outro par. 
Está-se interessado na manutenção do conjunto de máximos de uma colação C de pares preço- 
desempenho. Isto é, se gostaria de adicionar novos pares nesta coleção (por exemplo, quando 
um novo carro é introduzido), e se gostaria de pesquisar esta coleção para um dado valor em 
dólar — d — para procurar o carro mais rápido que não custe mais que d. 

Pode-se armazenar o conjunto de pares máximos em um dicionário ordenado D, ordenado 
pelo custo, mas que o custo seja o campo chave, e desempenho (velocidade) seja o campo valor, 
Pode-se então implementar as seguintes operações: add(c,p), que adiciona um novo par custo- 
desempenho (cp); e bestie), que retorna o melhor par com o valor custo no máximo c, como 
mostrado no Trecho de código 9.12. 


Algoritmo bestíc): 
Entrada: um custo c 
Saida: o par custo-desempenho de D com o maior custo menor ou igual a c ou nulo se 
nào existir 
В + D.predecessorsic) 
se B.hashNext() então 
retorna 5.next() [о primeiro elemento no iterator dos predecessores | 


Algoritmo addíc, р}: 
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Entrada: um para custo-desempenho (c, p) 
Saida: Nenhuma 


B «— D.predecessors(c) [iterator dos pares com custo de no máximo c] 
se E hasHext() então 
e €— Bnextl) i predecessor de c] 


se ¿.geWalue( ) > p então 


retorna 


tic. p) está controlado, desta forma não insira em Dl 


C + D.successor(c) [iterator do pares com custo de no mimino c] 
enquanto C.hasNextí) faça 


e «— C.nextí } [sucessor de c) 
se e.getvalue( ) < p então 
D.remowei e) (este par está controlado por (cp)! 
sendo 
pare com o laço “enquanto” [nào existem mais pares controlados por (c,p}] 
Dinsertic, p) (adiciona o par (cp), que não está controlado | 


Trecho de código 9,12 Os métodos para manutenção do conjunto máximo, implementado com 
um dicionário ordenado D. 


Ao implementar D usando skip list, pode-se executar a pesquisa best(c) no tempo esperado 
de Otlog т), e addíc, p) no tempo esperado O((1 + ур m), onde ré o número de pontos removi- 
dos. Assim, se estará habilitado para conseguir um bom tempo de execução para os métodos que 
mantém um conjunto de máximos. 


9.6 Exercícios 


Para obter auxílio e o código fonte dos exercícios, visite java.datastructures.net. 


Reforço 
R-9.1 


R-9.2 
R-9.3 


R-9,4 


R-9,5 


R-9.6 


Qual é à pior caso de tempo de execução para inserções de n elementos 
chave-valor em um mapa M inicialmente vazio que é implementado com 
uma segiiéncia”? 

Descreva como usar um mapa para implementar о TAD dicionário, assu- 
mindo que o usuário não tente inserir elementos com a mesma chave. 


Descreva como uma segiiéncia ordenada implementada como uma lista du- 
plamente encadeada poderia ser usada para implementar o TAD mapa. 


Qual seria um bom código de hash para um número de identificação de 
veículo que é uma cadeia de caracteres representando números e letras no 
formato "UX9XX90X0X X 9000097” onde um "9" representa um digito e 
um "X" representa uma letra? 


Desenhe a tabela de hash com 11 elementos, que resulta a partir do usa da 
tunção de hash, Ar) = (21 + 5) mod 11, para colocar as chaves 12, 44, 13, 
88, 23, 04, 11,39, 20, 16 e 5, assumindo que as colisões serão tratadas por 
encadeamento, 

Qual será o resultado do exercício anterior se assumirmos que as colisões 
serão tratadas por teste linear? 
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R-9.7 


R-9.5 


R-4,9 


R-9.10 


R-9.11 


R-9.12 


R-9.13 


R-9.14 


R-9.15 


R-9.16 


R-9.17 


R-9.1% 


Criatividade 


C-9.1 


C-9.2 


Mostre o resultado do Exercício R-9,5, assumindo que as colisões são tra- 
tadas por teste quadrático, até o ponto em que o método falha. 


Qual o resultado do Exercicio R-9.5, assumindo que as colisões são trata- 
das por hashing duplo usando uma função de hash secundária 444) = 7 = 
ik mod 7)? 

Forneça uma descrição em pseudocódigo da inserção em uma tabela de 
hash que usa teste quadrático para resolver colisões, assumindo que se usa 
о truque de substituir elementos deletados com um objeto indicando “item 
desativado”. 

Forneça uma deserção de Java dos métodos values( ) e entries( ) que po- 
deriam ser incluídas na implementação da tabela de hash apresentada nos 
Trechos de código 9.3 = 9,5 

Explique como modificar a classe HashTableMap, apresentada nos Trechos 
de códigos 9.3 — 9,5, para implementar o TAD dicionário em vez do TAD 
mapa. 

Mostre o resultado de fazer rehash na tabela de hash, mostrada na Figura 


9.4, para uma tabela de tamanho 19, usando a nova função de hash hik) = 
2k mod 1%, 

Discuta porque uma tabela de hash não é adaptada para implementar um 
dicionário ordenado. 

Qual é o pior tempo para inserir n elementos em uma tabela de hash inicial- 
mente vazia, com colisões sendo resolvidas por encadeamento”? Qual seria 
o melhor caso? 

Desenhe a skip list resultante da execução da seguinte sequência de opera- 
goes sobre a skip list da Figura 9.12: remove( 38). insert( A40), insert(24,y). 
remove(55). Registre as jogadas de cara e coroa, 

Apresente a descrição de um pseudocódigo da operação de remoção em 
uma skip list. 

Qual é o tempo de execução esperado dos métodos para manutenção de um 
conjunto de máximos inserindo-se ж pares tal que cada par tenha o menor 
custo e desempenho que um anterior a ele? O que estará contido em um 
dicionário ordenado ao final desta série de operações? Se um par tem o 
menor curso e maior desempenho qual será o anterior a ele? 

Argumente por que os localizadores não são realmente necessários para um 
dicionário implementado com uma boa tabela de hash, 


Descreva como usar um mapa para implementar o TAD dicionário, assu- 
mindo que o usuário pode tentar inserir elementos com a mesma chave. 

Suponha que são dadas duas tabelas de pesquisa ordenada S e T, cada 
qual com s elementos (com 5 e É sendo implementadas com arranjos). 
Descreva um algoritmo log’ n) para encontrar a k-ésima menor chave 
na união das chaves de se 7 (assumindo que não há chaves duplicadas). 


Apresente uma solução (log n) para o problema anterior. 


Hidden page 


370 Estruturas de Dados e Algoritmos em Java 


C-9.3 


C-9.14 


C-9.15 


C-9.16 


C-9.17 


P-9.6 


Р-9.7 


Suponha que cada linha de um arranjo А de tamanho n X a consiste em le 
0, tal que em qualquer linha de A todos os valores | venham antes de todos 
os valores 0. Assumindo que A esteja em memória, descreva um método 
com tempo Cin log a) (e não tempo On y) para contar o nümero de valo- 
res | em A. 


Descreva uma estrutura ordenada eficiente para um dicionärio que armaze- 
na n elementos e tem um conjunto de ordem total associado de k < n cha- 
ves. Ou seja, o conjunto de chaves é menor que o elemento, Sua estrutura 
deverá executar a operação findAll no tempo esperado de Oílog г + s), onde 
s É o número de elementos retornados, a operação entries( ) no tempo On) 
e operações restantes do TAD dicionário no tempo esperado de О(ор г). 


Descreva uma estrutura eficiente de dicionário para armazenar n elementos 
com r < n e chaves que contenham distintos códigos de hash. Sua estrutura 
deverá executar a operação findAll no tempo esperado de CM) + s), onde s é 
o número de elementos retornados, e a operação entries{ ) no tempo O(n), e 
operações restantes do TAD dicionário no tempo esperado de СКТ). 


Descreva uma eficiente estrutura de dados para implementar o TAD sacola, 
o qual suporta um método add(e), para adicionar um elemento arbitrário e 
na sacola, e um método remove ), o qual remove um elemento arbitrário da 
sacola. Mostre que ambos os métodos podem ser feitos no tempo O1). 


Descreva como modificar uma skip list para suportar o método atindex(i), 
que retorna a posição do elemento “base” na lista 5, com colocação i, pois 
ie [0, n — 1]. Mostre que sua implementação deste método tem tempo 
esperado log n). 


Implemente uma classe que implemente o TAD dicionário pela adaptação 
da classe java util HashMap 

Implemente o TAD dicionário com uma tabela de hash que trata as colisões 
com encadeamento separado (não adapte qualquer classe do pacote java. 
utili. 

Implemente o TAD dicionário ordenado usando uma seqüéncia ordenada. 


Implemente os métodos de um TAD dicionário ordenado usando uma 
skip list. 

Estenda o projeto anterior fornecendo uma animação gráfica da operação da 
skip list. Visualize como os itens se movem para cima na skip list durante à 
operação de inserção e como são retirados durante a remoção. Na operação 
de procura, visualize as varreduras e descidas para o nível inferior. 
Implemente um dicionário que suporta métodos baseados em localizadores 
através de uma sequência ordenada 

Faça uma análise comparativa que estuda as taxas de colisão para vários có- 
digos de hash para cadeias de caracteres, tais como códigos hash polinomiais 
para diferentes valores do parâmetro a. Use uma tabela de hash para deter 
minar colisões, mas apenas conte colisões em que cadeias diferentes levam 


ao mesmo código de hash (e não se elas levam à mesma posição da tabela de 
hash). Teste os códigos hash em arquivos encontrados na Internet. 
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POR Faça uma análise comparativa, como no exercício anterior, para números de 
telefone de dez dígitos, em vez de cadeias de caracteres. 
P-99 Projete uma classe Java que implemente a estrutura de dados skip list. Use 


esta classe para criar implementações de TAD mapa e TAD dicionário, in- 
cluindo métodos localizadores para o dicionário, 


Observações sobre o capítulo 


É interessante notar que o algoritmo de pesquisa binária foi publicado pela primeira vez em 
1946, mas só foi publicado em uma versão completamente correta em 1962. Para mais discus- 
ses sobre as lições a serem aprendidas desta história, veja o livro de Kruth [60] e os artigos de 
Bentley [12] e Levisse [65]. As skip lists foram introduzidas por Pugh [84]. A presente análise 
das skip lists é uma simplificação da apresentação feita no livro de Motwani e Raghavan [79]. 
Além disso, a discussão de hashing também é uma simplificação da apresentação daquele livro, 
O leitor interessado em outras construções probabilísticas para suportar dicionários (incluindo 
mais informação sobre hashing) pode verificar o livro de Motwani e Raghavan [79]. Para uma 
análise mais profunda sobre skip lists, o leitor pode consultar os artigos na literatura de estruturas 
de dados [57,81,82]. O Exercicio C-9,9 for uma contribuição de James Lee. 
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10.1 Árvores binárias de pesquisa 


Todas as estruturas que serão discutidas neste capítulo são drvores de pesquisa, isto é, estruturas 
de dados árvore que podem ser usadas para implementar um dicionário. Segue uma breve revisão 
dos métodos fundamentais do TAD dicionário: 


findik): Retorna um elemento com chave É, se ele existir. 
тА): Retorna uma coleção de todos os elementos com chave igual a k. 
insert(k, x): Insere um elemento com chave É e valor x. 
remove(e): Remove um elemento e, retornando-o. 


removeAll(k): Remove todos os elementos com chave É, retornando um iterador dos 
seus valores. 


O método find retorna null se k não for encontrada. O TAD dicionário ordenado inclui alguns 
métodos adicionais para pesquisar usando predecessores e sucessores de uma chave ou elemento, 
mas seus desempenhos são similares ao método find. Assim, este capítulo será focado no método 
find como operação de pesquisa básica. 

Árvores binárias são estruturas de dados excelentes para armazenar elementos de um dicio- 
nário, assumindo que se tem uma relação de ordem definida entre as chaves. Como mencionado 
anteriormente (Seção 7.3.6), uma árvore binária de pesquisa é uma árvore binária Fem que cada 
nodo interno v de 7 armazena um elemento (k, x) que: 


+ As chaves armazenadas na subárvore esquerda de v são menores ou iguais a k. 
+ As chaves armazenadas na subárvore direita de v são maiores ou iguais a К. 


Como mostrado abaixo, as chaves armazenadas nos nodos de T provéem uma forma de 
execução de uma pesquisa pela comparação de cada nodo interno v, o qual pode parar em v ou 
continuar com os filhos à esquerda ou à direita de v. Assim, armazenam-se elementos x somen- 
te na árvore interna da árvore binária de pesquisa, e os nodos externos servem somente como 
placeholders, Esta abordagem simplifica vários de nossos algoritmos de pesquisa ou alteração, 
Casualmente, poderiam ser permitidas árvores binárias de pesquisa impróprias, as quais usam 
melhor o espaço, mas às custas de métodos de pesquisa e atualizações mais complicados. 

Independentemente de as árvores binárias de pesquisas serem ou não próprias, a propriedade 
importante de uma árvore binária de pesquisa é a concretização de um dicionário ordenado (ou 
mapa). Esto é, uma árvore binária de pesquisa deve representar hierarquicamente a ordenação de 
suas chaves, usando relacionamentos entre pais e filhos. Especificamente, um caminhamento 
interfixado (Seção 7.3.6) dos nodos de uma árvore binária de pesquisa T deverá visitar as chaves 
em ordem não-decrescente. 


10.1.1 Pesquisa 


Para executar a operação find(k) em um dicionário D que é representado por uma árvore binária de 
pesquisa T, enxerga-se a árvore T como uma árvore de decisão (lembre-se da Figura 7.10). Neste 
caso, a questão feita para cada nodo interno v de T é se а chave de pesquisa k € maior, menor ou 
igual que a chave armazenada no nodo v, denotado key(v). Se a resposta for “menor”, então a pes- 
quisa continua na subárvore esquerda, Se a resposta for “igual”, então a pesquisa terminou com 
sucesso, Se a resposta for "maior", então a pesquisa continua na subárvore direita. Finalmente, 
encontrando-se um nodo externo, então a pesquisa se encerra com falha, (Ver Figura 10.1.) 

Esta abordagem é descrita em detalhes no Trecho de código 10.1. Dada uma chave de pes- 
quisa É e um nodo v de T, o método TreeSearch retorna um nodo (posição) w da subárvore Т(у) 
enraizada em v, de maneira que um dos dois casos ocorre: 
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Figura 10.1 (a) Uma árvore binária de pesquisa T representando um dicionário D com chaves 
inteiras; (b) nodos de T visitados quando da execução das operações find(76) (com sucesso) e 
find (25) (sem sucesso) em D. Para simplicidade, são mostradas as chaves mas não os valores dos 
elementos. 


+ we um nodo interno que armazena a chave $; 
+ w é um nodo externo representando a posição de k em um caminhamento interfixado de 
Tiv), mas k não é uma chave contida em Ti v). 


Deste modo, o método find(k) pode ser executado chamando-se o método TresSearch(k,T. 
root()). Seja w o nodo de T retornado por esta chamada ao método TreeSearch. Se o nodo w for 
interno, retorna-se o elemento armazenado em w; por outro lado, se w for externo, então se re- 
torna null. 


Algoritmo TreeSearchi& v): 
se 7 isExternal( v) então 
retorna v 
se k < key(vi então 
retorna TreeSearch(k.T leftívY) 
senão se k > key(v) então 
retorna TreeSearchik,T.right(v)) 
retorna v [conhece-se k = key(v)] 


Trecho de código 10.1 Pesquisa recursiva em uma árvore binária de pesquisa. 


Análise da árvore de pesquisa binária 


A análise do pior caso para o tempo de execução de uma pesquisa em uma árvore de pesquisa 
binária T é simples. O algoritmo TreeSearch é recursivo, e executa um número constante de ope- 
rações primitivas em cada chamada recursiva. Cada chamada recursiva de TreeSearch é feita so- 
bre um filho do nodo anterior. Isto é, TresSearch é chamada nos nodos de um caminho de T que 
inicia na raiz e desce um nivel por vez. Assim, o número de nodos é limitado por h + 1, onde hé 
a altura de T. Em outras palavras, uma vez que se gasta um tempo 001) em cada nodo encontrado 
na pesquisa, o método find sobre um dicionário D executa em tempo Olh), onde A é a altura da 
árvore de pesquisa binária 7 usada para implementar D. (Ver Figura 10.2.) 

Pode-se demonstrar também que uma variação do algoritmo acima executa a operação 
findAll E) em tempo O(h + 5), onde s é o número de elementos no iterador retornado. Entretanto, 
este método € um pouco mais complicado e seus detalhes ficam como um exercício (C- 10.1). 

Na verdade, a altura h de T pode ser grande como n, mas espera-se que normalmente seja 
menor. Além disso, será mostrado como manter o limite superior de O(log n) usando a altura da 
árvore de pesquisa T da Seção 10.2. Antes de se apresentar tal esquema, entretanto, serão descri- 
tas implementações de método de atualização de dicionários. 
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Tempo por 

Altura nivel 

EE _— CTI 
Árvore T: 
DUO 
di 

(X 

* E 


Tempo total: cui 


Figura 10.2 Demonstra o tempo de execução de uma pesquisa sobre uma árvore binária de 
pesquisa. A figura usa as formas de representação padrão, visualizando uma árvore binária de 
pesquisa como um grande triángulo, e o caminho a partir da raiz como uma linha em zigue- 
ZUR цв. 


10.1.2 Operações де atualização 


Arvores binárias de pesquisa permitem implementações de operações de inserção e remoção 
usando algoritmos que são mais diretos, mas não triviais. 


Inserção 
Uma árvore binária de pesquisa T suporta as seguintes operações de atualização: 


inserAtExternal(v, ch: insere o elemento e no nodo externo v, expande v para ser interno, tén- 
do um novo (e vario) filho do nodo externa; um erro ocorre se y é um 
nada interne, 


Dado este método, pode-se executar o método insert(k, x) para um dicionário implementado 
com uma árvore binária de pesquisa T chamando Treelnsertík, x, T.root( )), o qual é apresentado 
no Trecho de código 10,2. 


Algortimo Treelnsert( kx, v): 

Entrada: uma chave de pesquisa k, um valor associado x & um nodo v de T 

Saida: Um novo nodo w na subárvore T(v) que armazena o elemento (Ev) 

We TreeSearch( kv) 

sek = key(w) então (a chave w é igual a К, desta forma faça uma chamada recursiva para 
um filho} 
retorna Treelnsart(£.x, T leftiv)) [poderia ser utilizado o filho da direira] 

T.insertAtExternal wA. x) [este é o local apropriado para inserir (É, X) | 

retorna w 


Trecho de código 10.2 Algoritmo recursivo para inserção em uma árvore binária de pesquisa. 
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o Retorna-se o elemento previamente armazenado em w, que se salva na variável tem- 
porária 1. 
Como com pesquisa e inserção, este algoritmo de remoção cria um caminho a partir da raiz 
para um modo externo, possivelmente movendo um elemento entre dois nodos deste caminho, € 
então executa a operação removeExternal para o nodo externo. 


Figura 10.4 Remoção da árvore de pesquisa binária da Figura 10.3b, na qual a chave a ser re- 
movida (32) está armazenada no nodo (м) com um filho externo: (a) antes da remoção, (b) após 


à remoção, 


Figura 10.5 Remoção da árvore binária de pesquisa da Figura 10.3b, na qual o elemento a ser 
removido (com chave 65) está armazenado no nodo (w) cujos filhos são internos: (a) antes da 
remoção, (b) após a remoção. 


Desempenho da árvore binária de pesquisa 


A análise do algoritmo de remoção é análoga à dos algoritmos de inserção e pesquisa, Gasta-se 
tempo O(1) em cada nodo visitado e, no pior caso, o número de nodos visitados é proporcional 
à altura В de T. Portanto, em um dicionário D implementado usando uma árvore de pesquisa bi- 
nária T, os métodos find, insert e remove executam no tempo O(h), onde h é a altura da árvore T. 
Assim, uma árvore binária de pesquisa T é pequena. No melhor caso, T tem altura A, tal que À = 
| login + Lo que resulta em uma performance logarítmica para bodas as operações do dicioná- 
rio. No pior caso, entretanto, 7 tem altura e; consequentemente, sua aparência é a de uma seqüén- 
cia ordenada de um dicionário. Esta configuração de pior caso ocorre, por exemplo, inserindo-se 
uma série de chaves em ordem crescente ou decrescente (ver Figura 10,6). 


Figura 10,6 Exemplo de uma árvore binária de pesquisa com altura linear, obtida pela inserção 
de elementos com chaves em ordem crescente. 


O desempenho de um dicionário implementado com uma árvore binária de pesquisa é resu- 
mida na seguinte proposição e na Tabela 10.1. 


Proposição 10.1 Uma drvore binária de pesquisa T com altura h para n elementos chave- 
valor usa o espaço An) e executa as operações do TAD dicionário com os seguintes tempos de 
execução. Operações size e isEmpty custam o tempo OC) cada uma. Operações find, insert e 
remove levam o tempo Oih) cada uma. A operação findAll custa o tempo Oih + s) onde sé o 
tamanho da coleção retomada. 


(Método | Tempo | 
вай [Oh+5)] 


Tabela 10.1 Tempos de execução dos principais métodos de um dicionário implementado com 
uma árvore binária de pesquisa, Denota-se a altura da árvore como sendo k e o tamanho da cole- 
ção retornada pelo método findAll como s. O espaço usado é ín), onde n € o número de elemen- 
tos armazenados no dicionário. 


O tempo de execução das operações de pesquisa e atualização em uma árvore binária de pes- 
quisa varia dramaticamente dependendo da altura da árvore. No entanto, na média, uma árvore 
binária de pesquisa com n chaves geradas a partir de uma série randômica de inserções e remo- 
ções de chaves tem a altura esperada de log n). Como um comando requer cuidado de uma 
linguagem matemática para precisar o que se quer prover, esta justificativa vai além do escopo 
deste livro. Apesar disso, é preciso manter em mente o pior caso de desempenho e tomar cuidado 
para o uso padrão de árvores binárias de pesquisa em aplicações nas quais as alterações não são 
randômicas. Após tudo isso, existem aplicações em que é essencial ter um dicionário com um 
rápido pior caso nos tempos de pesquisas e atualizações. A estrutura de dados apresentada na 
próxima seção endereça esta necessidade. 


10.1.3 Implementação Java 


Nos Trechos de códigos 10.3 a 10,5, é descrita uma classe de árvore binária de pesquisa, Binary- 
SearchTree, a qual armazena objetos da classe BSTEntry (implementação da interface Entry) nos 
seus nodos. A classe BinarySearchTree estende a classe LinkedBinaryTree dos Trechos de código 
7.16 a 7.18 e assim usando da vantagem do reuso de código. 
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Esta classe usou vários métodos auxiliares para fazer o trabalho pesado. O método auxiliar 
treeSearch. baseado no algoritmo TreeSearch (Trecho de código 10,1), € invocado pelos méto- 
dos find, findAll e insert. Usa-se um método addAI recursivo como o principal mecanismo para o 
método findAll, no qual executa um caminhamento interfixado de todos os elementos com chave 
igual a É (não através de um algoritmo rápido, visto que ele executa uma pesquisa falha para cada 
elemento que encontra). Usam-se dois métodos de atualização adicionais, insertAtExternal, o 
qual insere um nodo elemento em um nodo externo, e removeExternal, o qual remove um nodo 
externo e seus pais. 

А classe BinarySearchTree usa localizadores (ver Seção 8.4.2). Desta forma, seus métodos de 
atualização informam a qualquer objeto BSTEntry alterado sua nova posição. Também usam-se 
vários métodos auxiliares simples para acessar e testar os dados, como checkKey, o qual verifica 
se a chave é válida (apesar de usar uma simples regra neste caso). Usa-se, também, uma variável 
de instância, actionPos, a qual armazena a posição onde a mais recente pesquisa, inserção ou 
remoção foi finalizada. Esta variável de instância não é necessária para a implementação de uma 
árvore binária de pesquisa, mas é útil para classes que estenderão a classe BinarySearchTree (ver 
Trechos de código 10.7, 10,8, 10.10 e 10.11) para identificar a posição onde a pesquisa, inserção 
ou remoção anterior ocorreu. À posição actionPos tem a intenção de prover o uso correto após a 
execução dos métodos find, insert e remove. 


“ Implementação de um dicionário com uma árvore binária de pesquisa 
public class BinarySearchTree<K W> 
extends LinkedBinary Trees Entry - K, V >> implements Dictionary K, W= 1 
protected Comparator<K> C; // comparador 
protected Position Entry - K,V >> 
actionPos; // pai do nodo inserido ou removido 
protected int numEntrias = 0: Y número de elementos 
/** Cria uma BinarySearch Tree com um comparador padrão. */ 
public BinarySearchTreel ) { 
C = new DefaultComparator FK (Y 
addRoot(null; 
| 
public BinarySearchTree(Comparator-K-- c) T 
C nc, 
addioatinull: 


¿** Classe aninhada para o localizador dos elementos da árvore binária de pesquisa */ 
protected static class BSTEntry<K,V> implements Entry К. | 

protected K key: 

protected V value; 

protected Position Entry - K Y> > pos; 

BSTEntry( ) | /* construtor padrão */ ) 

BSTEntry(K К, V v, Position Entry К, > р) ( 

key = k; value = v; pos = pr 

} 

public К getKey() { return key; } 

public V gotvaluve() { return value: ] 

public Position<Entry< K, V >> position) { return pos; } 


/** Retorna a chave do elemento de um dado nodo da árvore, */ 
protected К key(Position Entry K V >> position) I 

return position elementi ).getKey( ); 
} 


/** Retorna o valor do elemento de um dado nodo da árvore, */ 
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protected V value(Position Entry KV: > position) ( 
return pasition.element( ).getValue( ): 
| 
/** Retoma o elemento de um dado nodo da árvore. */ 
protected Entry<K,V> entry(Paosition--Entry - K,V- > position) [ 
return position.elementi }; 
} 
/** Substitui um elemento por um novo elemento (e inicializa a localização do elementos) */ 
protected void replaceEntry(Position <Entry<KV >> pos, Entry-- K,V- ent) ( 
((BSTEntry - КУ >} ent pos = pos; 
replace(pos, ent); 
} 


Trecho de código 10.3 Classe BinarySearchTree (continua no Trecho de código 10.4). 


PH Verifica se uma determinada chave é válida. */ 
protected void checkKey/K key) throws InvalidKeyException [ 
ifikey == null)  // um simples teste 
throw new InvalidKeyException(" chave nula”); 
} 
+ Verifica se um determinado elemento é válido, */ 
protected void checkEntry(Entry« К.Л ent) throws InvalidEntryException [ 
fent == null || (ent instanceof BSTEntry)) 
throw new InvalidEntryExceptioni"elemento inválido"); 


+ Método auxiliary para inserir um elemento em um nodo externo */ 
protected Entry - v> insertAtExternal(Position Entry K, V v, Entry « K,V- e) [ 
expandExternal(v,null, null); 
replacelv, е); 
numEntries-- +; 
return e; 


/** Método auxiliary para remover um nodo externo e seu pai */ 
protected void removeExternallPosition<Entry<K,Wo>> v) T 
removeAboveExternallvy, 
numEntries— — ; 


r** Método auxiliary usado para pesquisar, inserir e remover, */ 
protected Position Entry -K, V^ > treeSearch(K key, Position Entry c K, V > pos) [ 
if (isExternal(pos)) return pos; //chave nào encontrada; retorna o nado externo 
else | 
К curkey = keyipos); 
int comp = C.compareikey, битке; 


if (comp < 0) 

return treeSearch(key, leftipos)); tt Pesquisa na subárvore à esquerda 
else if (comp > 0) 

return treeSearch(key, right(pos]); “ Pesquisa na subárvore à direita 
return pos; // retoma o nodo interno onde a chave foi encontrada 


| 
| 


H Adiciona a L todos os elementos da subárvore enraizada em v, tendo as chaves iguais a К 
protected void addAll(PasitianList« Entry c K,V == L, 
Position Entry KV > v, K k) ( 
if (isExternalivy) return; 
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Position « Entry K,V- > pos = treeSearch(k, v); 

if ('isExternal(pos]) | // encontrou-se um elemento com chave igual ak 
addAlliL, leftipos), К}; 
L.addl astipos.elerenti JJ; ¿adiciona elementos 
addANL, rightipos), ky; 

++ este algoritmo recursivo é simples, mas não е O mais rápido 


Trecho de código 10.4 Classe BinarySearchTree (continua no Trecho de código 10.5). 


if métodos do TAD dicionário 

public int sizo( } [ return numEntries; } 

public boolean isEmpty ) { return size ) i 

public Entry -K,V-- find(K key) throws InvalidKeyException | 
checkKeylker) V pode langar uma exceção InvalidseyException 
Positian« Entry KV -- curPos = treaSaarch(key, moti |}; 


actionPos = curPos; tí nodo onde a pesquisa finalizou 
if fisinternalicurPos)) return entry(curPos); 
return null; 


} 
public Iterabla-- Entry - K,V-- -- findAIl(K key) throws InvalidKeyException | 
checkKeylkey); // pode lançar uma exceção InvalidKeyException 
PositionList<Entry<K,V>> L = new NodePositionList - Entry - K, V ==}; 
addälliL, root), key); 
return L; 
| 
public Entry Ky insert K k, V х) throws InvalidKeyException | 
checkKey(k)  //pode lançar uma exceção InvalidKeyException 
Position Entry КМ > insPos = treeSearch(k, root( ji; 
while (isExternalfinsPos)) “(pesquisa iterative para encontrar a posição de inserção 
insPos = treeSearchik, leftinsPos}}; 
actionPos — insPos; nodo onde o novo elemento está sendo inserido 
return insertAtExternalinsPos, new ESTEntry<K Vk, x, insPos)l; 
| 
public Entry< KV > remove(Entry КМ ent) throws InvalidEntryException ( 
checkEntry(ant); if pode lançar uma exceção InvalidEntryException 
Position Entry K,V-— > remPos = [([BSTEntry-- K,V =) ent) position T; 
Entry-K,V- toReturn = entryjremPosi; JV elemento a ser retornado 
if (sExternalfeftiremPos)) remPos = leftfremPos); ¿left easy case 
else if (isExternal(rightiremPos)) remPos = rightiremPos) — // right easy case 
else [ H elemento está no nado com filhos internos 
Position--Entry-- K V>> swapPos = remPos; // encontra o nodo movendo o elemento 
remPos = nght(swapPasy 
do 
remPos = leftiremPos): 
while (isinternaliremPos)); 
replaceEntry(swapPos, (Entry К) parentiremPos) elementi |): 
} 
actionPos = siblingiremPos); “irmãos da folha a ser removida 
removeExternaliremPos]; 
return toReturn; 


¿método entries( | é omitido aqui 


Trecho de código 10,5 Classe BinarySearchTree (continuação do Trecho de código 10.4). 
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árvores AVL com o número minimo de nodos: um com altura 4 — Deo outro com altura Л — 
2, Levando a raiz em consideração, a seguinte fórmula relaciona mr) com nih — 1) & nh — 2), 
para h zz 3: 


n(h) = 1 + mh — ly + nih — 2). (10.1) 


Neste ponto, o leitor familiarizado com as propricdades de uma progressão Fibonacci (ver 
Seção 2.2.3 e Exercicio C-4.12) verá que nifi) é uma função exponencial em Ah. Para os demais 
leitores, se prosseguirá com este raciocinio. 

A Fórmula 10.1 implica que rd) é uma função crescente de ^. Desta forma, sabe-se que n 
— 1) 2 nihi — 2). Substituindo mik — E) por mit — 2) na Fórmula 10.1 e descartando o 1, obtém- 
se, para A = 3, 


rfi) 2 hi — 2), (10.2) 


A Fórmula 10.2 indica que nih) no mínimo dobra cada ver que й cresce em 2, o que intui- 
tivamente significa que m) cresce exponencialmente. Para mostrar este fato de uma maneira 
formal, aplica-se a Fórmula 10.2 repetidamente, revelando a seguinte série de desigualdades: 


nh) > 2- n(h — 2) 


= d-n(h— 4) 
-ÀR-n(h 6 
>= > {Йй Mp (10.3) 


Ou seja. мй) = 2 - nih — 2), para qualquer inteiro i, tal que А — 2i = 1. Uma vez que os 
valores de nl 1) e n(2) ра são conhecidos, pega-se i de maneira que 4 — 21 seja igual à | ou 2. Ou 


Seja, USA-SE 
i 
i- | 1 ER 
å 


Substituindo o valor de é na Fórmula 10.3 obtém-se, para ft = 3, 


ZU > ua DU 2 [5 |+2) 

> iaf) 

S sel 

2x (10.4) 

Pegando às logaritmos de ambos os lados da Fórmula 10,3, resulta 
h 
logr(h) > == |, 
a partir do qual obtém-se 
< 2 log nih) + 2, (10,5) 


que implica que uma árvore AVL armazenando n chaves tem altura no mínimo 2 log m + 2. E 


Pela Proposição 10.2 e pela análise das árvores de pesquisa binária vista na Seção 10.1, as 
operações find e findAll, em um dicionário implementado usando-se uma árvore AVL, executa 
em tempo ilog s) e O(log n + 5), respectivamente, onde é o número de itens no dicionário 
es é o tamanho do iterador retomado por findAll. O aspecto importante que resta é mostrar 
como manter à propriedade da altura/balanceamento de uma árvore AVL depois de uma in- 
sergio ou remoção, 


Árvores de Pesquisa 385 


10.2.1 Operações de atualização 


As operações de inserção e remoção para árvores AVL são similares äquelas para árvores biná- 
nas, mas com árvores AVL é preciso executar cálculos adicionais. 


Inserção 


Uma inserção em uma árvore AVL T inicia como em uma operação insert, descrita na Seção 
10.1.2, para uma árvore binária de pesquisa (simples). Deve-se lembrar que essa operação sem- 
pre insere o novo item no nodo w de T, que foi previamente um nodo externo, e transforma w em 
nodo interno com a operação insertAtExternal. Isto é, adiciona dois nodos filhos externos em w. 
Entretanto, essa ação pode violar à propriedade de balanceamento da altura, pois alguns nodos 
incrementam sua altura em um. Em particular, o nodo w, e possivelmente alguns de seus ances- 
trais, terão sua altura acrescida de um. Conseqüentemente, será descrito como reestruturar T para 
restaurar sua altura balanceada. 

Dada uma árvore de pesquisa binária 7, diz-se que um nodo v de T está balanceado se o 
valor absoluto da diferença entre as alturas dos filhos de v for no máximo I, e diz-se que está 
desbalanceado no caso contrário, Então, caracterizar uma árvore AVL pela propriedade da altu- 
ra/balanceamento equivale a dizer que todos os seus nodos internos estão balanceados. 

Suponha que T satisfaça a propriedade da altury balanceamento e por isso é uma árvore AVL, 
antes de se inserir um novo item. Como mencionamos, depois de executar a operação insertAt- 
External em T, as alturas de alguns nodos de T, incluindo w, crescem, Todos esses nodos estão 
no caminho de T, que parte de w e vai até a raiz de T, € são os únicos nodos de T que podem ter 
se deshalanceado. (Ver Figura 10.84.) Naturalmente, se isso ocorrer, então T não será mais uma 
árvore AVL: conseqúentemente, necessita-se de um mecanismo para consertar o “desbalancea- 
mento” recém-causado, 


La] (bh) 


Figura 10.8 Um exemplo de inserção de um elemento com chave 54 na árvore AVL da figura 
10.7: (a) depois da inserção de um novo nodo para a chave 54, 08 nodos que armazenam as cha- 
ves 78 e 44 se tomam desbalanceados.; (b) uma reestruturação trinodo restaura a propriedade da 
altura/balanceamento. Mostram-se as alturas dos nodos próximos aos mesmos e identificam-se 
os nodos x, y e z como participantes da reestruturação do trinodo. 


O balanceamento dos nodos em uma árvore binária T é restaurado por meio de uma estraté- 
gia simples de “pesquise e conserte". Em especial, faz-se z ser o primeiro nodo que se encontra 
indo para cima a partir de w em direção à raiz de T, de maneira que z fique desbalanceado (ver 
Figura 10.84). Além disso, faz-se v denotar os filhos de z com uma altura mator (e observa-se que 
y tem de ser um ancestral de wj. Finalmente, faz-se x ser o filho de у com uma altura maior (e se 
houver um nó, escolhe-se x para ser o ancestral de w). É importante observar que o nodo x por ser 
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Rotação simples 


(a) 


Rotação simples 


(b) 


Rotação dupla 


(c) 


Rotação dupla 


(d) 


Figura 10.9  Iustragào esquemática de uma operação de reestruturação trinodo (Trecho de có- 
digo 10.6). As partes (a) e (b) mostram uma rotação simples, enquanto às partes (c) e (d) mostram 
uma rotação dupla. 


Remoção 


Como foi no caso da operação de inserção no dicionário, inicia-se a implementação da operação 
de remoção em uma árvore AVL T pelo uso do algoritmo para executar esta operação em uma ár- 
vore binária de pesquisa, A dificuldade adicionada nesta abordagem com árvores AVL é que pode 
ser violada a propriedade da altura/balanceamento. Em particular, após remover um nodo interno 
com a operação removeExternal e elevar um de seus filhos para o seu lugar, pode ficar um nodo 
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nào-balanceado em T no caminho a parte do pai w do nodo removido anteriormente para a raiz 
de T. (Ver Figura 10.102.) De fato, pode existir somente um nodo nào-balanceado no máximo, À 
justificativa deste fato é deixada como exercício (C- 10. 109. 


ía) (hi 


Figura 10.10 Remoção do elemento cam chave 32 da árvore AVL da Figura 10.7: (a) após a 
remoção do nodo que armazena a chave 32, a raiz fica nào-balanceada; (b) uma (simples) rotação 
restaura à propriedade da altura/halanceamenta. 


Usa-se a restruturagdo trinodo para restaurar o balanceamento na árvore T, como na inser- 
ção. Em particular, sendo z o primeiro nodo náo-balanceado encontrado a partir de w através da 
raiz de T. Além disso, sendo y o filho de z com uma grande altura (vide que y é o filho de 2, que 
não é um ancestral de 4), e x sendo o filho de y definido como segue: se um dos filhos de y É mais 
alto que o outro, toma-se x como o filho mais alto de y; sendo (ambos + filhos de v tem a mesma 
altura), toma-se x como o filho de y no mesmo lado de y (isto é se y é um filho à esquerda, x será 
um filho à esquerda de v, sendo x será o filho à direita de v). Neste caso, executa-se uma operação 
restructure( x), que restaura a propriedade altura-halanceamento localmente, na subärvore que 
foi previamente enraizada em z e é agora enraizada no nodo que temporariamente se chama de 
b. (Ver Figura 10,106.) 

Desafortunadamente, esta reestruturação trinodo pode reduzir em 1 a altura da subárvore en- 
raizada em b, o que pode causar que algum ancestral de b fique desbalanceado, Assim, depois do 
rebalanceamento de z, continua-se caminhando em T procurando por nodos desbalanceados. En- 
contrando-se algum, executa-se uma operação restructure para restaurar seu balanceamento. Ainda, 
desde que a altura de T seja log n), onde n é o número de elementos, pela Proposição 10.2, Сор 
n) reestruturações trinodo são suficientes para restaurar à propriedade altura-balanceamento, 


Desempenho das árvores AVL 


segue-se um resumo da análise de desempenho de uma árvore AVL 7. As operações find, insert 
e remove visitam o nodo junto com um caminho raiz-para-folha de T, mais, possivelmente, seus 
irmäos, € gastam o tempo O l) por nodo. Assim, desde que a altura de T seja Оов n) dada pela 
Proposição 10.2, cada uma das operações citadas gasta o tempo O(log m). Deixa-se a implemen- 
tação e análise de uma versão eficiente da operação findAll como um interessante exercício. Na 
Tabela 10.2. resume-se o desempenho de um dicionário implementado com uma árvore AVL. 
Este desempenho é ilustrado na Figura 10.11. 


10.2.2 Implementação Java 


Volta-se a atenção agora para detalhes de implementação e analisa-se o uso de uma árvore AVL 
T com n nodos internos para implementar um dicionário ordenado de n itens. Os algoritmos 
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10.3- 10.5) e inclui uma classe aninhada, AVLMode, que estende a classe BTNode usada para 
representar os nodos de uma árvore binária. A classe AvLNode define uma variável de instância 
adicional height, que representa a altura do nodo. Pega-se nossa árvore binária para usar esta 
classe de nodo em vez da classe BTNode simplesmente sobrecarregando o método createNode, o 
qual é usado exclusivamente para criar um novo nodo da árvore binária. A classe AVLTree herda 
as métodos size, isEmpty, find e findAll da superclasse, BinarySearchTree, mas sobrecarrega os 
métodos insert e remove para manter a árvore de pesquisa balanceada. 

O método insert (Trecho de código 10.8) inicia chamando o método insert da superclasse, 
que insere o novo item e atribui à posição de inserção (nodo armazenando a chave 54, na Figura 
10,8) para a variável de instância actionPos. O método auxiliar rebalance é então usado para per- 
correr o caminho desde a posição de inserção até a raiz. Este caminhamento atualiza a altura de 
todos os nodos visitados e executa uma reestruturação trinodo se necessário. Da mesma forma, 
o método remove (Trecho de código 10.5) se inicia chamando o método da superclasse remove, 
que executa a remoção do item e atribui a posição que substitui o item eliminado para a variável 
de instância actionPos. O método auxiliar rebalance é então usado para percorrer à caminho 
desde a posição removida até a raiz, executando qualquer necessidade de restruturação. 


/** Implementação de uma árvore AVL. */ 
public class AVLTree< KV > 
extends BinarySearchTree- KV = implements Dictionary K,V-- | 
public AVLTrae(Comparatar-- K — c) [ superic):) 
public AVLTrea( VI superi Y | 
/** classe aninhada para os nodos de uma árvore AVL. */ 
protected static class AVLMNode--K,V- extends BTNode- Entry K, W= | 
protected int height; — // adiciona-se um campo height para um nodo BTMode 
AMLINOdel | {7° construtor padrao^/] 
/** construtor preferido*;/ 
AVLMode[Entry« K,V-- element, BTPositian<Enty<KW >> parent, 
BTPosition<Enty<k.V> > left, BTPosition Entry - K,V— — right) 1 
super(element, parent, left, right); 
height = 0; 
if (left != null) 
height = Math.maxiheight, 1 + ЦАМ Месе К.у) Feftj.getHeighti |; 
if (night != nul) 
height = Math.maxiheight, 1 + ПАМ. одек =) right).getHeighti ||; 
ү? Assume-se que o pai revisará seua altura se necessário 
public void setHeightünt п) [ height = h; } 
public int getHeight() ( return height; } 


/** Cria uma nova árvore binária de pesquisa (versão de sabercarga). */ 
protected BTPosition<Entry<K,V>> createNode(Entry-- К А element, 
BTFosition c Entry--K,V--- parent, BTFosition--Entry-- K, V > left, 
BTFosition-Entry-- K, V ==> right) | 
return new AVLNode<E V> (element parent left, right); ¿fuso de nodos AVL 
| 
/** Retorna а altura de um nodo (retornando para um AVI Модер. */ 
protected int height(Position= Епїгү< К V >> p) { 
return (АМ Моде К 72) p.getHeight |: 


/** Define a altura de um nodo interna (retornando para um АМ. Моде). */ 
protected void setHeight(Position<Entyy<K,V>> pj ( 

ЦАМ Моде= K, V>) p.setHeight(1--Math.max(heightüleftipp, neightinightip 
} 
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10.3 Árvores splay 


Outra forma que se pode implementar as operações fundamentais de um dicionário é por 
meio de uma estrutura de dados para árvore de pesquisa balanceada conhecida como drvore 
splay. Esta estrutura é, sob o ponto de vista conceitual, totalmente diferente das outras árvores 
de pesquisa balanceadas discutidas neste capítulo: para uma árvore splay não se usa regras 
explicitas para forçar o seu balanceamento, Ao contrário, aplica-se uma certa operação mover- 
para-raiz. chamada splaying, após cada acesso, para manter a árvore de pesquisa balanceada 
em um senso amortizado, A operação splaying é executada no nodo x mais abaixo durante 
uma inserção, remoção ou uma pesquisa. À surpresa sobre o splaving é que este permite 
garantir uma amortizada no tempo de execução, para inserções, remoções e pesquisas, que é 
logarítmica. A estrutura da drvore splay é simplesmente uma árvore binária de pesquisa T. De 
fato, não existe altura, balanceamento ou cor do rótulo adicional que se associa com os nodos 
desta árvore. 


10.3.1 Espalhamento 


Dado um nodo interno x de uma árvore binária de pesquisa T, aumenta-se x pelo movimento de 
x para a raiz de J através de uma sequência de reestruturações. As reestruturacóes particulares 
são executadas como importantes, e 1550 não é suficiente para mover x para a raiz de T justamente 
com qualquer reestruturação de seqiéncias. A operação especifica é executada para mover x para 
cima, dependendo da posição relativa de x, seus pais v e (caso exista) os seus avós т. Três casos 
são considerados: 


zig-zig: О nodo xe seus pais y são filho à esquerda ou filho à direita. (Ver Figura 10.12.) Troca- 
se z por x, fazendo com que y seja um filho de x e z seja um filho de y, enquanto marn- 
Lér-se o relacionamento interfixado dos nodos de 7, 

zig-zag: Um de ce y é um filho à esquerda, e o outro é um filho à direita. (Ver Figura 10.13.) 
Neste caso, tracu-se z por x e faz-se com que x tenha y e z como filhos, enquanto se 
reecstruturam os relacionamentos imterfixado dos nodos de 7. 

zie: x não tem avós (ou não se está considerando avós de x para algumas razões). (Ver Fi- 
gura 10.14.) Neste caso, rotaciona-se x sobre у, fazendo com que os filhos de x sejam 
o nodo ve filho w de x, assim para manter o relacionamento interfixado relativo dos 
nodos de T. 


A 


Figura 10.12  Zig-zig: (a) antes; (b) depois. Existe outra configuração simétrica onde x e y são 
filhos a esquerda. 
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Figura 10.13 Zig-zag: (a) antes; (b) depois, Existe outra configuração simétrica onde x é u 
filho a direita e v é um filho à esquerda. 


(a) (b) 


Figura 10.14 Zig: (a) antes; (b) depois. Existe uma outra configuração simétrica onde x e w 
são filhos à esquerda. 


Executa-se um zig-zig ou um zig-zag quando x tem um avó, e execula-se um zig quando x 
possui um pai, mas não possui avó. Um espalhamento consiste em repetir estas reestruturações 
de x até que x se torne a raiz de T. Deve-se observar que isso ndo é o mesmo que a sequência de 
rotações simples que levam x para a raiz. Um exemplo de espalhamento de um nodo é mostrado 
nas Figuras 10.15 e 10.16. 


10.3.2 Quando espalhar 
As regras que ditam quando espalhar são executadas como segue: 


* Quando pesquisamos pela chave A, se К é encontrada em um nodo x, espalhamos x, senão 
espalhamos o pai de um nodo externo no qual termina-se à pesquisa sem sucesso, Por 
exemplo, os espalhamentos nas Figuras 10,15 e 10.16 seriam executados após a pesquisa 
ocorrer com sucesso para a chave 14, ou sem sucesso рага a chave 14.5. 

e Quando se insere a chave k, espalha-se o novo nodo interno criado onde £ é insendo, Por 
exemplo, os espalhamentos das Figuras 10.15 e 10.16 seriam executados se 14 for a nova 
chave inserida. Mostra-se uma seqiiéncia de inserções em uma árvore splay na Figura 10,17, 

+ Quando se remove uma chave k, espalha-se o pai do nodo w que é removido, isto é, wé o 
nodo que armazena a chave k ou é um de seus descendentes. (Deve-se lembrar o algoritmo 
de remoção das árvores binárias de pesquisa.) Um exemplo de espalhamento seguido de 
uma remoção é apresentado na Figura 10.18. 
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(a) 


(ch 


Figura 10.15 Exemplo de espalhamento de um nodo: (a) espalhamento o nodo que armazena 
14 iniciando com um zig-zag; (b) após o zig-zag: (c) próximo passo é um zig-zig. (Continua na 
Figura 10.16.) 
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ыыы —ÀÀ— ÓN 


Figura 10.18 Remoção em uma árvore splay: (a) um remoção da chave 8 do nodo r é execu- 
tada pela mudança de r para o nodo interno mais à direita v, na subárvore a esquerda de r, remo- 
vendo v, e espalhando o par m de v; (b) expansão de u inicia com um zig-zig: (c) após o zig-zZig: 
(d) o próximo passo é um zig; (e) após o zip. 


Desempenho amortizado das árvores splay 


Para esta análise, deve-se observar que o tempo para execução de uma pesquisa, Inserção ou 
remoção é proporcional ao tempo para ao espalhamento associado. Assim, considera-se somente 
o tempo de espalhamento. 

Considere-se T uma árvore splay com т chaves, e v um nodo de T. Define-se o tamanho nv) 
de v como o número de nodos em uma subárvore enraizada com v. Nota-se que esta definição 
implica que o tamanho de um nodo interno é maior que a soma dos tamanhos de seus dois filhos, 
Define-se а classificação riv) de um nodo v como o logaritmo na base 2 do tamanho de v, insto 
é r(v) = loginy. Claramente, a raiz de T tem o tamanho máximo (24 + 1) e à classificação 
máxima, log(2n + 1), enquanto que cada nodo externo tem o tamanho 1 e classificação 0, 

Lisam-se ciberdólares para pagar pelo trabalho que se executa no espalhamento de um nodo 
x em 7 e assume-se que um ciberdólar paga um zig. enquanto que dois ciberdólares pagam para 
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um zig-zig ou um zig-zag. Então, o custo do espalhamento de um nodo com profundidade d é d 
ciberdölares, Mantém-se uma conta virtual que armazena os cyber-dollars de cada nodo interno 
de T. Deve-se observar que esta conta existe somente como proposta da análise amortizada, e nào 
necessita ser incluída em uma estrutura de dados que implementa a árvore splay 7. 


Uma análise contadora do espalhamento 


Quando se executa um espalhamento, paga-se um certo número de ciberdólares (o valor exato do 
pagamento será determinado no final da análise). Distinguem-se trés casos: 


+ Se o pagamento for igual ao trabalho de espalhar, então tudo é usado tudo para pagar a 
expansão, 

* Seo pagamento for maior que o trabalho de espalhar, o excesso é depositado mas contas 
de diversos nodos. 

e Seo pagamento for menor que o trabalho de espalhar, são feitas retiradas das contas de 
vários nodos para cobrir a deficiência, 


Será mostrado, no resto desta seção, que um pagamento de Сов n) ciberdólares por opera- 
ção é suficiente para manter o sistema trabalhando, isto é, para assegurar que cada nodo mante- 
nha па conta um balanço nào-negatrvo. 


Lima invariante de ciberdólar para o espalhamento 


Usa-se um esquema em que transferências são criadas entre às contas dos nodos para garantir 
que sempre existirão ciberdólares para retiradas рага o pagamento do trabalho de espalhar quan- 
do necessário. 

Para fazer o uso do método contador para executar nossa análise de espalhar, mantém-se a 
seguinte invariante: 


Antes е depois de um espalhamento, cada nodo v de T tem riv) ciberdólares na 
sua conia. 


Deve-se observar que a invariante é "Tinanceiramente sólida”, visto que não requer que se 
crie um depósito preliminar para favorecer uma árvore sem chaves, 

Seja r(T) a soma da classificação de todos os nodos de T. Para preservar a invariante após 
um espalhamento, deve-se fazer um pagamento igual ao trabalho de espalhar mais à alteração 
total de AT). Refere-se à uma simples operação zig, zig-zig ou zig-zag em um espalhamento 
como um sebpasso de um espalhamento, Além disso, denota-se a classificação de um nodo v de 
T antes e depois de um subpasso do espalhamento com riv) e rivi, respectivamente. À seguinte 
proposição apresenta um limite superior das alterações de r( P7) causado por um simples subpasso 
do espalhamento. Será usado repetidamente este lema em nossa análise de um espalhamento 
completo de um nodo para a raiz. 


Proposição 10.3 Seja à a variação de AT) causada por um simples subpasso do espalhamento 
(um zig, zig-zig ou zig-zag) para urn nodo x em T, Tem-se o seguinte: 


e d= rito nx 2 se o subpasso for um zig-zig ou um zig-zag. 
+ = Mr'(x) міх se o subpasso for um zig 


Justificativa Usa-se o fato (ver Proposição A.l, Apéndice Aj que, se a = 0, b 2 Ü ec = a+ b, 
log a + log b = 2 loge — 2. (10.6) 


Considere-se a alteração em Tt causada por cada tipo de subpasso do espalhamento. 
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zig-zig: (Deve-se relembrar a Figura 10.12.) Visto que o tamanho de cada nodo é um a mais que 
o tamanho de seus dois filhos, nota-se que somente as classificações de x, y e z alteram em 
uma operação zig-zig, onde y é o pai de x e z é pai de y. Além disso, r'(x) = rizh r'(y) = 
Fie rv) = nx). Assim 


& = Forro + rigor Av nz 
= oriy)triz--ríx — ny 
s rx) rid 250). (10.7) 


Vide que nix) + n'(z) = n'(x). Assim, em 10,6, rix) + r'(z) = Ar (a) — 2, que é, 
ri) x2n (x) = rx) — 2. 
Esta desigualdade e 10.7 implicam 
ó (х) + (rix) rx) — 2) — Arla) 
Sir (me) — Mæn) — 2. 


lh If 


zig-zag: (Deve-se relembrar a Figura 10,13.) Novamente, pela definição do tamanho e classifi- 
cação, somente a classificação de x, v e z mudam, onde v denota o pai de x e z denota o pai 
de v. Além disso, f'(x} = r(z) e rix) = ny). Assim 


б = rüx)- riy) riz) rix — riv) — nz) 
= rl) + riz) — na — rtv) 
= rv + (гї — Ina) (10.8) 


Vide que n'(v)  n'(z) = A (x); Então, pela 10.6, (y) + r'(z) = 2r'(x) — 2. Assim, 
б 


Zr (x) — 2 — 2ríx) 
Mr'(x) — rix!) — 2. 


A IA 


zig: (Deve-se relembrar a Figura 10.14.) Neste caso, somente a classificação de x e v alteram, 
onde y denota o pai de x. Além disso, ro) = nv) e r'(x) = rx). Assim 


© = river) ny) nal 
= Fla)— nz) 
= Mr (al = mx) " 


Proposição 10.4 Seja T uma drvore splay com raiz te À a variação total de nT} causada pelo 
espalhamento de um modo x com profundidade d. Tem-se 


A= ЩЧ nO d+ 2 


Justificativa O espalhamento do nodo x consiste de p = EA subpassos do espalhamento, 
cada qual é um zig-zig ou zig-zag. exceto pelo último que é um zig se d for impar. Seja r (1) = 
río a classificação inicial de x, e parai = Lp, seja гїл} a classificação de x após o enésimo 
subpasso e 5, seja a variação de n T) causado pelo enésimo subpasso, Pelo Lema 10.3, a variação 
total À de AT) causada pelo espalhamento de x é 


Aa = $s 
iz| 


P 
= * Gir, бх) = r iri = 2) + 2 
Iz] 


= Hr (xd mia) — dp +2 
= ИА Ad + 2. E 


MM) 
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Pela Proposição 10.4, fazendo-se um pagamento de rir) — ni) + 2 ciberdólares através 
do espalhamento do nodo x, haverá ciberdólar suficientes para manter a invariante, mantendo 
r(v) ciberdólares em cada nodo v de Te pagando para todo o trabalho de espalhar, com custo 
de d dólares. Posto que o tamanho da raiz té 2n + 1, sua classificação será r(r) = log(2n + 1), 
Além disso, tem-se гїл} < Rin. Assim, o pagamento a ser feito para o espalhamento será log 
n) ciberdólares. Para completar nossa análise, tem-se computado o custo para manutenção da 
invariante quando um nodo é inserido ou removido. 

Quando se insere um nono nodo v em uma árvore splay com л chaves, a classificação de 
todos os ancestrais de v são incrementados. Em outras palavras, seja vy. v, ..., v, os ancestrais de 
v, onde v, = v, v, é o pai de v, ev, é a raiz Parai= dd seja п iv) e riv.) o tamanho de v, 
antes e depois da inserção, respectivamente, e seja (4) e rv) a classificação de v, antes e depois 
da inserção, respectivamente. Tem-se 


n'v) = niv) + 1. 


Além disso, desde que лїї + 1 = miv, рага? = 0,1, df — |, tem-se o seguinte para 
cada à deste dominio: 


rv) = logía (vr Y) = login(v) + 1) s logintv, 1) = rivi) 


Assim, a variação total de 117) causada pela inserção é 
d de! 
Dire) re) = rrd + ЕУ (riv...) — rtv) 
i-i ja] 
= riv — nv 
= log (In + 1). 


Por esta razão, um pagamento de O(log i) ciberdólares é suficiente para manter a invariante 
quando um novo nodo é inserido. 

Quando se remove um nodo v de uma árvore splay com n chaves, a classificação de todos 
os ancestrais de v são decrementadas. Assim, a variação total de ri 7) causada pela remoção é 
negativa, e não se precisa fazer nenhum pagamento para manter a invariante quando o nodo for 
removido, Então, pode-se resumir a análise amortizada na seguinte proposição (que algumas 
vezes é chamada de “Proposição de balanceamento” para árvores splay): 


Proposição 10.5 Considere-se uma sequência de m operações em uma ärvore splav, cada uma 
verdi uma pesquisa, inserção OH rema, iniciando Em durum drvare splay ЧР пенһини chave. 
Sendo п o nimero de chaves na árvore após a operação i e n sendo o mimero total de inserções. 
O tempo de execução total para a execução da seqiiencia de operações é 


CH en + Y logn, 


o qual é Om log m. 

Em outras palavras, o tempo de execução amortizado da execução de uma pesquisa, inserção 
ou remoção em uma árvore splay é log n, onde n о tamanho da árvore splay neste momento. 
Assim uma árvore splay pode conseguir um tempo logarítmico, com desempenho amortizado 
para a implementação de um TAD dicionário ordenado. Este desempenho amortizado é compa- 
tível com o desempenho do pior caso de árvores AVL, árvores (2,4) e árvores vermelho-pretas, 
mas ela usa uma simples árvore binária que não precisa de qualquer balanceamento extra para 
informações armazenadas em cada um dos seus nodos, Além disso, árvores splay tém um nú- 
mero de outras propriedades interessantes que não são compartilhadas com estas outras árvores 
balanceadas. Explora-se mais uma propriedade adicional na seguinte proposição (que algumas 
vezes é chamada de “Proposição Static Optimally” para árvores splay): 
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ee == —————— 


Proposição 10.6  Considere-se uma seqüencia de m operações em uma drvore splay, cada uma 
sendo uma pesquisa, inserção ou remoção, iniciando em uma árvore splay T com nenhuma cha- 
ve, Sendo fi) o número de vezes que o elemento i é acessado na drvore splay, isto é sua freqiién- 
cia, e sendo n o número total de elementos. Assume-se que cada elemento é acessado pelo menos 
uma vez, então a tempo de execução total para a execução da seqüencia de operações é: 


o т+ У flogin по) 


Omite-se a prova desta proposição, mas isso não é tão dificil justificar. como se pode imagi- 
nar. O excelente € que esta proposição expressa que o tempo de execução amortizado do acesso 
ao elemento i é Olog(m/ft D. 


10.4 Árvores (2,4) 


Algumas estruturas de dados que se discutem neste capítulo, incluindo a árvore (2, 4), são árvo- 
res genéricas de pesquisa, isto €, árvores com nodos internos que tem dois ou mais filhos. Assim, 
antes de se definir árvores (2,4), serão discutidas árvores genéricas de pesquisa. 


10.4.1 Árvore genérica de pesquisa 


É preciso lembrar que árvores genéricas são definidas de forma que cada nodo interno pode ter 
vários filhos. Nesta seção, se discutirá como árvores genéricas podem ser usadas como árvores 
de pesquisa. Lembrando sempre que o elemento que se armazena em uma árvore de pesquisa é 
um par no formato (Ex), onde k é a chave e x é o valor associado com a chave. Entretanto, não 
se discutirá agora como executar atualizações em árvores genéricas de pesquisa, visto que os 
detalhes dos métodos de atualizações dependem de propriedades adicionais que se desejam para 
manter árvores genéricas, que se analisarão na Seção 14.3.1. 


Definição de uma árvore genérica de pesquisa 


Seja v um nodo de uma árvore ordenada. Diz-se que v é um nodo-d se v tiver d filhos. Define-se 
uma drvore genérica de pesquisa como sendo uma árvore ordenada T que tem as seguintes pro- 
priedades, que são ilustradas na Figura 10.192: 


+ Cada nodo interno de T tem ao menos dois filhos, Isto é, cada nodo interno é um nodo-d, 


onde d = 2. 

* Cada nodo-d v de T, com filhos v... É, armazena d — | itens (E, x). (E, x, ) onde 
k ==, |. 

+ Define-se, por convenção, А = —oc ek, = +, Para cada item (k x) armazenado em um 


nodo da subárvore de v enraizada em vp i= 1,....d tem-se que k, , S = 


Ou seja, considerando-se o conjunto de chaves armazenadas em v, incluindo as chaves ficti- 
cias especiais É, = —oc e k, = +00, então uma chave & armazenada na subárvore de T enraizada 
no nodo filho v, deve estar “entre” duas chaves armazenadas em v. Este ponto de vista simples 
origina a regra que diz que um nodo com d filhos armazena d — 1 chaves regulares e forma a base 
do algoritmo de pesquisa em uma árvore genérica de pesquisa. 

Pela definição acima, os nodos externos de uma árvore genérica de pesquisa não armazenam 
nenhum item, servindo apenas como “guardadores de locais”. Desta forma, vê-se uma árvore binária 
de pesquisa (Seção 10.1) como um caso especial de árvore genérica de pesquisa onde cada nodo 
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interno armazena um item e tem dois filhos, No extremo oposto, uma árvore genérica de pesquisa 
pode ter apenas um único nodo interno que armazena todos os itens. Além disso, apesar dos nodos 
externos poderem ser null, assume-se por definição que são nodos que não armazenam nada. 


Figura 10,19 (a) Uma árvore genérica de pesquisa T; (b) Caminho de pesquisa em T para а chave 
12 (pesquisa sem sucesso); (c) caminho de pesquisa em 7 para a chave 24 (pesquisa com sucesso), 


Tendo os nodos internos de uma árvore genérica dois ou mais filhos, entretanto, existe uma 
relação interessante entre o número de itens e o número de nodos externos 
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Proposição 10.7 Uma drvore de pesquisa genérica que armazena n itens tem n + | nodos 
externos, 


Deixa-se a justificativa desta proposição como um exercício (C- 10. ] 4). 


Pesquisando em uma árvore genérica 


Dada uma árvore genérica T, pesquisar por um elemento com chave k é simples. Executa-se tal 
pesquisa seguindo um caminho em T que se inicia na raiz (ver Figura ТО ТОБ e c). Quando se 
estiver em um nodo-4 v durante esta pesquisa, se comparará a chave k com as chaves É... É, 
armazenadas em v. Se & = É para algum і, a pesquisa é encerrada com sucesso, Caso contrário, 
continua-se a pesquisa no filho v, de v de maneira que &, = E < К. (É preciso lembrar que se 
considera k= = о ek, = +00) Atingindo-se um nodo externo, então sabe-se que não há ne- 
nhum item com a chave k em 7, e a pesquisa termina sem sucesso. 


Estruturas de dados para árvores de pesquisa genéricas 


Na Seção 7.1.3, discutem-se diferentes maneiras de representar árvores genéricas. Cada uma 
dessas representações também pode ser reutilizada para árvores de pesquisa genérica. Na verda- 
de, ao se usar uma árvore genérica para implementar uma árvore de pesquisa genérica, a única 
informação adicional que se precisa armazenar em cada nodo é o conjunto de itens (incluindo as 
chaves) associados com os mesmos. Ou seja, precisa-se armazenar em v uma referência para um 
contéiner ou objeto coleção que armazene os itens de v. 

É preciso lembrar que quando se usa uma árvore binária para representar um dicionário or- 
denado D, simplesmente se armazena uma referência para um único item em cada nodo interno. 
Usando uma árvore de pesquisa genérica T para representar D, deve-se armazenar uma referência 
para um conjunto ordenado de itens associados com v em cada nodo interno v de 7. Esta argu- 
mentação pode parecer recursiva em um primeiro momento, uma vez que se necessita de uma re- 
presentação de um dicionário ordenado para representar um dicionário ordenado. Pode-se evitar 
esta recursividade, entretanto, usando a técnica bootstrapping, em que a solução anterior (menos 
desenvolvida) de um problema é usada para uma criar uma solução nova (mais avançada). Neste 
caso, à bootstrapping consiste em representar o conjunto ordenado associado com cada nodo 
interno usando a estrutura de dados para dicionário que se construiu anteriormente (por exemplo, 
urna tabela de pesquisa baseada em um vetor ordenado, como mostrado na Seção 9.3.3). Em par- 
ticular, assumindo que se dispõe de uma maneira de implementar dicionários ordenados, pode-se 
implementar uma árvore de pesquisa genérica usando uma árvore T e armazenando tal dicionário 
em cada nodo-d v de 7. 

O dicionário que se armazena em cada nodo v é conhecido como uma estrutura de dados 
secundária, na medida em que é usado para suportar a estrutura de dados maior, a primária, 
Denota-se o dicionário armazenado no nodo v de T como iv). Os itens que armazenamos em 
Div) nos permitem determinar para qual nodo filho se deve ir durante uma operação de pesquisa. 
Especificamente, para cada nodo v de T, com filhos v, .... v, e itens (kj. he (E, n, 1), arma- 
zena-se no dicionário Dv) os itens 


(Кү, ns vA {К Os uus (ea po Gy vu V CE o0, (0, v )). 


Ou seja, um item (К, (x, v) de um dicionário D(v) tem chave É e elemento (x, v). Observe 
que o último item armazena a chave especial +, 

Com esta implementação de uma árvore de pesquisa genérica 7, o processamento de um 
nodo-d v durante uma pesquisa por um elemento de T com chave & pode ser feito executando-se 
uma operação de pesquisa para encontrar o item (X, (x, ў, em Div) com a menor chave maior ou 
igual a k. Distinguem-se dois casos: 


Hidden page 
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Figura 10.22 Sequência de inserções em uma árvore (2,4): (a) árvore inicial com um item; (b) 
inserção de 6; (c) inserção de 12; (d) inserção de 15, causando um overflow; (e) divisão, implica 
na criação de um novo nodo raiz; (1) após a divisão, (g) inserção de 3; (h) inserção de 5, causando 
um overflow: (i) divisão; (j) após a divisão: (К) inserção de 10 (1) inserção de 8, 


árvore (2,4) sempre pode cair no caso em que o item a ser removido esteja armazenado em um 
nodo v cujos filhos são nodos externos. Supondo-se, por exemplo, que o item com chave É que 
se deseja remover esteja armazenado no i-ésimo item (k. x.) no nodo 2, que tem apenas nodos 
internos como filhos. Neste caso, troca-se o item (A, ху} por um item apropriado que esteja arma- 
zenado no nodo v com nodos externos como filhos, como segue (Figura 10.24d): 


1. Encontra-se o nodo interno v mais a direita da subárvore enraizada no à-ésimo filho de 
z, notando que os filhos do nodo v são todos nodos externos. 
2. Troca-se o item (k, х) de z pelo último item de v. 
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Figura 10.23 Uma inserção em uma árvore (2,4) causa divisões em cascata: (a) antes da inser- 
ção, (b) inserção de 17 causando overflow; (c) uma divisão; (d) após a divisão um novo overflow 
ocorre; (e) outra divisão criando um novo nodo raiz; (f) árvore final. 


Uma vez que se garante que o item a ser removido esteja armazenado em um nodo v que tem 
apenas nodos externos como filhos (porque já estava em v ou porque foi tirado de v). simplesmen- 
te se remove o item de v (isto €, do dicionário Dir) e o -simo nodo externo de v. 

A remoção de um item (e um filho) de um nodo v, como descrito anteriormente, preserva 
a propriedade da profundidade, porque sempre se remove um nodo externo filho de um nodo v 
que tem apenas nodos externos como filhos. Entretanto, retirando nodos externos, pode-se violar 
a propriedade do tamanho em v. Na verdade, se v era um nodo-2, então ele se torna um nodo-1 
sem itens após a remoção (Figuras 10.24d e e), o que não é permitido em uma árvore (2,4). Este 
tipo de violação da propriedade do tamanho é chamado de underflow do nodo v. Para remediar 
um underflow, verifica-se quando um irmão de v é um nodo-3 ou um nodo-4, Encontrando-se tal 
irmão w, então se executa uma operação de transferência, na qual se move um filho de w para v. 
uma chave de w para o pai u de v, e uma chave de u para v (ver Figura 10.24b e c). Se v tiver ape- 
nas um irmão ou se os dois irmãos, imediatos de v são nodos-2, então executa-se uma operação 
de fusão, na qual se une v com um irmão, criando um novo nodo v^, e movendo uma chave do pai 
u de v para v'. (Ver Figura 10.25e e f.) 

Uma operação de fusão no nodo v pode causar um novo underflow, que irá ocorrer no pai 
и йе v, que por sua vez dispara uma transferência ou fusão em u (ver Figura 10.25). Então, о 
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Figura 10.24  Seqüéncia de remoções de uma árvore (2,4): (a) remoção de 4, causando un- 
derflow: (b) operação de transferência; (c) após a operação de transferência; (d) remoção de 12, 
causando underflow; (e) operação de fusão; (f) após a operação de fusão; (g) remoção de 13; (h) 
após a remoção de 13. 


número de operações de fusão é limitado pela altura da árvore que é Ойор m) pela Proposição 
10.8. Se um underflow se propaga até a raiz, então esta é simplesmente removida, (Ver Figura 


10.25c e d.) Apresenta-se uma sequência de remoções de uma árvore (2,4) nas Figuras 10.24 
e 10.25. 
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Figura 10.25 Propagação de uma sequencia de fusões em uma árvore (2,4): (a) remoção de 14, 
causando um underflow; (b) fusão, causando outro underflow; (c) segunda operação de fusão, 
causando a remoção da raiz; (d) árvore final. 


Desempenho de arvores (2,4) 


A Tabela 10.3 resume os tempos de execução das principais operações de um dicionário imple- 
mentado usando uma árvore (2.4). A análise de complexidade do tempo é baseada no seguinte: 
* A altura de uma árvore (2,4) que armazena n itens é O(log n), pela Proposição 10.8. 


* Uma operação de divisão, transferência ou fusão leva tempo CM 1). 
+ Uma pesquisa, inserção ou remoção de um item visita ON log n) nodos. 


Oog) 
TIA 


Tabela 10.3 Performance de um dicionário com n elementos implementados usando uma árvore 
(2,4), onde s denota o tamanho dos iteradores retornados por findAll. O espaço utilizado € Om). 


Desta forma, árvores (2,4) oferecem operações rápidas de pesquisa e alteração em dicioná- 
rios. As árvores (2,4) também têm um relacionamento interessante com a estrutura de dados que 
será discutido a seguir. 


10.5 Árvores vermelho-pretas 


Apesar de árvores AVL e (2,4) terem várias propriedades interessantes, existem algumas aplica- 
ções de dicionário para as quais elas não são muito adequadas. Por exemplo, árvores AVL podem 
requerer a execução de muitas operações de reestruturação (rotações) após a remoção de um ele- 
mento, e as árvores (2,4) podem exigir a execução de muitas operações de fusão ou divisão tanto 
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após inserções como remoções. A estrutura de dados que será discutida nesta seção, à árvore ver- 
melho-preta, não apresenta esses problemas, pois exige que podem ser feitas somente alterações 
estruturais CX 1) após uma atualização, visando manter o balanceamento, 

Uma drvore vermelho-preta é uma árvore de pesquisa binária (ver a Seção 10.1) com nodos 
coloridos de vermelho e preto, de forma a satisfazer as seguintes propriedades: 


Propriedade da raiz: a raiz É preta. 

Propriedade externa: todo nodo externo é preto. 

Propriedade interna: os filhos de um nodo vermelho são pretos. 

Propriedade da profundidade: todos os nodos externos têm a mesma profundidade preta que 


é definida como o número de ancestrais pretos menos um. (Deve-se lembrar que um nodo é 
um ancestral dele mesmo.» 


Um exemplo de árvore vermelho-preta é apresentado na Figura 10,26, 


Figura 10.26 Árvore vermelho-preta relacionada com a árvore (2,4) da Figura 10.20, Cada 
nodo externo desta árvore vermelho-preta tem 4 ancestrais pretos (incluindo ele mesmo); portan- 
to, tem profundidade preta 3. Foi utilizada a cor cinza em vez de vermelho. Além disso, usa-se à 
convenção de dar para as arestas a mesma cor do nodo filho. 


Como tem sido convencionado neste capítulo, pressupõe-se que os itens são armazenados 
nos nodos internos da árvore vermelho-preta, com os nodos externos sendo lugares vagos. Além 
disso, descrevem-se nossos algonimos pressupondo que são nodos reais, mas se nota que ao cus- 
to de algoritmos de pesquisa e atualização um pouco mais complicados, nodos externos podem 
ser null. 

Pode-se tornar à definição de uma árvore vermelho-preta mais intuitiva, observando uma 
correspondencia interessante entre árvores vermelho-pretas e árvores (2,4), como demonstrado 
na Figura 10,27, Isto é, dada uma árvore vermelho-preta, pode-se construir a árvore (2,4) cor- 
respondente combinando todo nodo vermelho v com seu pai, e armazenando o item de v no seu 
pai. Da mesma forma, pode-se transformar qualquer árvore (2,4) em sua árvore vermelho-preta 
correspondente, calorindo cada nodo de preto e executando as seguintes transformações sobre 
cada nodo interno v: 


Se vé um nodo-2, então mantenha os filhos (pretos) de v como estão. 
Se v é um nodo-3, então crie um novo nodo vermelho w, passe os primeiros dois filhos 
(pretos) de v para w, e faça we o terceiro filho de y serem os filhos de v. 

* Scvéum nodo-4, então crie dois novos nodos vermelhos we z, passe os dois primeiros 
filhos (pretos) de v para w, passe os dois últimos filhos (pretos) de v para г, e faça wez 
serem os dois filhos de v. 
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Figura 10.28 Reestruturação de uma árvore vermelho-preta para remediar um vermelho duplo: 
(a) as quatro configurações para mv € т antes da reestruturação, (b) após a reestruturação. 


(b) 


Figura 10.29 Trocando cores para remediar o problema do vermelho duplo: (a) antes da troca 
de cores e o nodo-5 correspondente na árvore (2,4) associada antes da divisão; (b) depois da troca 
de cores (e os nodos correspondentes na árvore (2,4) associada após a divisão). 
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(hi 


lo) 


Figura 10.32 Reestruturação de uma árvore vermelho-preta para remediar o problema do du- 
plo preto: configurações (a) e (b) antes da reestruturação, com r sendo um filho da direita, jun- 
tamente com os nodos associados na árvore (2,4) correspondente antes da transferência (duas 
outras configurações simétricas são possíveis com ғ sendo o filho da esquerda: configuração (c) 
após a reestruturação, e os nodos associados na árvore (2,4) correspondente após a transferência. 
А cor cinza do nodo x nas partes (a) e (hj e para o nodo 5 na parte (c) denotam o fato de que este 
nodo pode ser colorido, tanto de vermelho como de preto. 
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(a) 


(h) 


Figura 10.33 Alterando as cores de uma árvore vermelho-preta para consertar o problema do 
duplo preto: (a) antes da alteração de cores e os nodos correspondentes na árvore (2,4) associada 
antes da fusão (outras configurações semelhantes são possíveis): (b) após a troca de cores e no- 
dos correspondentes na árvore (2,4) associada após a fusão. 


Desempenho das árvores vermelho-pretas 


A Tabela 10.4 resume os tempos de execução das principais operações do dicionário implemen- 
tado usando uma árvore vermelho-preta. As justificativas para esses limites são apresentadas na 
Figura 10.38. 


Oos) 
finda 


Tabela 10,4 Performance de um dicionário de n elementos implementado, usando uma árvore 
vermelho-preta em que s denota o tamanho dos neradores retornados por НАЗА. O espaço utili- 
zado é On). 


Desta forma, uma árvore vermelho-preta obtém tempo de execução logaritmico para o pior 
caso tanto para pesquisa como para atualização em um dicionário. A estrutura da árvore verme- 
Iho-preta é ligeiramente mais complicada que a árvore (2,4) correspondente. Apesar disso, uma 
árvore vermelho-preta tem a vantagem conceitual de requerer apenas um número constante de 
reestruturações trinodo para restaurar o balanceamento após uma atualização. 
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(a) 


(b) 


Figura 10,34 Troca de cores de uma árvore vermelho-preta para propagar o problema do du- 
plo preto: (a) configuração antes da alteração das cores e nodos correspondentes na árvore (2,4) 
associada antes da fusão (outras configurações similares são possíveis); (b) configuração após a 
troca de cores e nodos correspondentes na árvore (2,4) associada após a fusão, 


10.5.2 Implementação Java 


Nos Trechos de código 10.9 — 10,11, são apresentados trechos da implementação em Java de um 
dicionário organizado usando uma árvore vermelho-preta. A classe principal inclui uma classe 
aninhada, RBNode, mostrada no Trecho de código 10.9, que estende a classe BTNOde usada para 
representar um item chave-valor de uma árvore de binária de pesquisa. Define uma variável de ins- 
tância adicional isRed, representando à cor do nodo, e métodos para atribuir é retornä-lo. 


/** Implementação de um dicionário com uma árvore vermelho-preta. */ 
public class RBTree<KV> 
extends BinarySearchTree<K,V> Implements Dictionary--K,V-- [ 
public RBTree( | { superi ); } 
public RBTree(Comparator-- К> C) { super(C); ) 
/** Classe aninhada para os nodos da árvore vermelho-preta */ 
protected static class RENode--K,V- extends BTNode- Entry K,V—— [ 
protected boolean isRed; if Adiciona-se um campo cor para um BTNode 
RBNode( ) (/* Contrutor padráo*/) 
/** Construtor preferido */ 
RBModeEntry —-K,V- element, BTPasition Enty =K V >> parent, 
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(b) 


Figura 10.35 Ajuste de uma árvore vermelho-preta na presença do problema de um duplo 
preto: (a) configuração antes do ajuste e nodos correspondentes na árvore (2,4) associada (uma 
configuração simétrica é possível), (hb) configuração após o ajuste com os mesmos nodos corres- 
pondentes na árvore (2,4) associada. 


BTPasition -Entry-—K, V 2 left, BTPosition« Entry K,V--» right) { 
super(alement, parent, left, right); 
isHed = false; 
} 
public boolean isHed() (return isRed;} 
public void makeRed() isRed = true) 
public void makeBlack() [isRed = false:) 
public void setColoriboolean color) [isHed = color;) 
} 


Trecho de código 10.9 Variáveis de instância, classe amnhada e construtor para RBTres. 


A classe ABTree (Trechos de código 10.9 = 10.11) estende a classe BinarySearchTree (Tre- 
chos de código 10.3 = 10,5), Assume-se que a classe pai suporta o método restructure para execu- 
tar à reestruturação trinodo (rotações), sua implementação foi deixada como exercício (P- 10.3). 
A classe RBTree herda os métodos size, isEmpty, find e findAll da classe BinarySearchTree. mas 
sobrecarrega os métodos insert e remove. Implementa estas duas operações, primeiro pela cha- 
mada ao método correspondente da classe pai, e entáo remediando qualquer violação de cor que 
esta alteração pode ter causado. Vários métodos auxiliares da classe ABTree não são mostrados, 
mas seus nomes sugerem seus significados, e suas implementações são diretas. 
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C-10.22 


Projetos 
P-10.1 
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heap unificável h com o presente, destruindo as versões antigas de ambos, 
Descreva uma implementação concreta para o TAD heap unificável que ob- 
tenha performance Of log n) para todas as suas operações. 


Considere uma variação da árvore splay chamada drrores half-splay, onde 
a expansão de um nodo com profundidade d para assim que o nodo consi- 
ga à profundidade Lat? |. Execute uma análise de amortização das árvores 
half-splay. 

A etapa de expansão padrão requer duas passagens, uma descida para en- 
contrar o nodo x para expansão, seguida por uma subida para expandir o 
nodo x. Descreva um método para expansão e pesquisa pelo nodo x em um 
passo de descida. Cada subpasso requer que você considere os próximos 
dois nodos no caminho abaixo de x, com um possível subpasso zig executa- 
do no final. Descreva como executar os passos zig-zig, zig-zag e zig. 


Descreva uma sequência de acessos a um nodo п da árvore splay T, onde 
n é impar que resulta em T, consistindo em uma simples cadeia de nodos 
internos com filhos que são nodos externos, no qual o caminho do nodo 
interno abaixo 7 alterna entre o filho à esquerda e o filho à direita. 


Explique como implementar um arranjo de n elementos onde os métodos 
add e get levam o tempo Oflog n) no pior caso (sem a necessidade de um 
arranjo expansível). 


Simulações de n-corpos são ferramentas de modelagem importantes na fi- 
sica, astronomia e química. Neste projeto, você tem que escrever um pro- 
grama que execute uma simples simulação de n-corpos chamada “Duendes 
Saltitantes”*, Esta simulação envolve n duendes, numerados de | até n. Ela 
mantém um valor ouro g, para cada duende i. e se inicia com cada duende 
começando com o valor do ouro em um milhão de dólares, isto é, g= 1 000 
000 para сайат = 1, 2..... п. Além disso, a simulação também mantém, para 
cada duende i, um lugar no horizonte, que é representado com um número 
de ponto flutuante de dupla precisão, « Em cada iteração da simulação, 
esta processa os duendes na ordem, O processamento da um duende duran- 
te esta iteração inicia pela computação de um novo lugar no horizonte para 
i, que é determinado pela seguinte tarefa 


хо х, = Р, 


onde r é um número de ponto flutuante gerado randomicamente dentro 
do intervalo — 1 € 1, O duende г entáo rouba metade do ouro do duende 
mais próximo de um dos seus lados e adiciona este ouro no seu valor de 
ouro y. Escreva um programa que possa executar uma série de iterações 
nesta simulação para um dado número, m, de duendes. Tente incluir uma 
visualização dos duendes nesta simulação, incluindo seus valores de ouro 
è posições no horizonte, Você pode manter o conjunto de posições do 
horizonte usando uma estrutura de dados de dicionário ordenado descrita 
neste capítulo. 


* N. de T. O autor utiliza a expressão “Jumping Leprechauns". 
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P-10.2 Estenda a classe BinarySearchTree (Trecho de código 10,3 — 10,5) para 
suportar os métodos de um TAD dicionário ordenado (ver Seção 9.5.2). 

P-10.3 Implemente um classe RestructurableNodeBinaryTree que suporte os méto- 
dos de um TAD árvore binária, mais um método restructure para execução 
de uma operação de rotação. Esta classe é um componente da implementa- 
ção de uma árvore AVL apresentada na Seção 10.2.2. 

P-10.4 Escreva uma classe Java que implemente todos os métodos de um TAD 
dicionário ordenado (ver Seção 9,5,2) usando uma árvore AVL. 

P-10.5 Escreva uma classe Java que implemente todos os métodos de um TAD 
dicionário ordenado (ver Seção 9,5,2) usando uma árvore (2,4). 

P-10.6 Escreva uma classe Java que implemente todos os métodos de um TAD 
dicionário ordenado (ver Seção 9.5.2) usando uma árvore vermelho-preta. 

P-10.7 Forme uma equipe de três programadores e que cada membro implemente 
um dos trés projetos apresentados anteriormente. Faça um extensivo es- 
tudo para comparar a velocidade de cada um destas três implementações. 
Projete três conjuntos de experimentos, cada um favorecendo uma diferen- 
te implementação. 

P-10,8 Escreve uma classe Java que possa pegar qualquer árvore vermelho-preta 
e converê-la em uma árvore (2,4) correspondente e possa pegar qualquer 
árvore (2,4) e converté-Ia em uma árvore vermelho-preta correpondente. 

P-10.9 Execute um estudo experimental para comparar o desempenho de uma ár- 
vore vermelho-preta com uma skip list. 

P-I0. 10 Prepare uma implementação de árvores splay que utilizem expansão bot- 
tom-up como descrito neste capítulo с outra que utilize uma expansão top- 
down como descrito no Exercício C- 10.20. Execute um estudo experimental 
extensivo para verificar qual implementação é melhor na prática, se houver. 


Observações sobre o capítulo 


Algumas das estruturas de dados discutidas neste capítulo são descritas em detalhes por Knuth 
no seu livro Sorting and Searching [63] e por Mehlhorn em [74]. As árvores AVL são atribuídas 
a Adel'son- Vel'skii e Landis [1], que inventaram essa classe de árvores de pesquisa balanceadas 
em 1962, Arvores de pesquisa binária, árvores AVL e estruturas de hash são descritas por Knuth 
no seu livro Sorting amd Searching [63]. Análises de altura média para árvores de pesquisa biná- 
ria podem ser encontradas nos livros de Aho, Hopcroft e Ulman [5] e Cormen, Leiserson e Rivest 
[25]. O manual de Gonnet e Bazea- Yates [41] contém uma boa quantidade de comparações expe- 
rimentais e teóricas entre implementações de dicionários. Ahos, Hoperoft e Ulman [4]. discutem 
árvores (2,3), que são similares a árvores (2,4). Árvores vermelho-pretas são definidas por Bayer 
[10]. Variações e propriedades interessantes de árvores vermelho-pretas são apresentadas em um 
artigo de Guibas е Sedgewick [46], O leitor interessado em aprender mais sobre diferentes tipos 
de estruturas de árvores balanceadas deve procurar os livros de Mehlhorn [74] е Tarjan [91] e 
o capitulo de livro de Mehlhorn e Tsakalidis [76]. Knuth [63] é uma leitura adicional excelente 
que inclui abordagens mais recentes de árvores balanceadas, Árvores splay foram inventadas por 
Sleator and Tarjan [36] (ver também [91 |). 
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11.1 Merge-sort 


Nesta seção, será apresentada uma técnica de ordenação chamada merge-sort. que pode ser des- 
crita de uma forma simples e compacta usando recursão. 


11.1.1 Divisão e conquista 


O merge-sort baseia-se em um padrão de projeto chamado divisão e conquista (divide-and-con- 
quer). O paradigma de divisão e conquista pode ser descrito, de maneira geral, como sendo 
composto de três fases: 


1. Divisão: se o tamanho da entrada for menor que um certo limite (por exemplo, um ou 
dois elementos), resolve-se o problema usando um método direto e retorna-se a solução 
obtida. Em qualquer outro caso, divide-se os dados de entrada em dois ou mais conjun- 
tos disjuntos. 

2, Recursüo: soluciona-se os problemas associados aos subconjuntos recursivamente. 

3. Conquista: obtém-se as soluções dos subproblemas e junta-se as mesmas em uma única 
solução para o problema original. 


Usando divisão e conquista para ordenação 


No problema da ordenação tem-se uma coleção de n objetos, tipicamente armazenados em uma 
lista ou arranjo, junto com algum comparador que define uma relação total de ordem nesses 
objetos, e que se deve gerar uma representação ordenada deles. O algoritmo de ordenação será 
descrito em alto nivel para sequências e será explicado em detalhes o que é preciso para imple- 
mentá-las será descrito usando listas e arranjos, Para o problema de ordenar uma seguência de n 
elementos, os três passos de divisão e conquista são os seguintes: 


1. Divisão: se 5 tem zero ou um elemento, retorna-se 5 imediatamente; já está ordenado. 
Em qualquer outro caso (5 tem pelo menos dois elementos), removem-se todos os ele- 
mentos de $ e colocam-se em duas sequências, 5, e $,, cada uma contendo aprox imada- 
mente a metade dos elementos de 5, ou seja, 5, contém os primeiros [л / 2] elementos 
de Se $, contém os restantes | n / 2 | elementos. 

à. Recursão: ordenam-se recursivamente as sequências 5, e $. 

3. Conquista: os elementos são colocados de volta em 5, unindo as sequências 5, e 5, em 
uma seqüéncia ordenada. 


No que se refere ao passo de divisão, é importante lembrar que a notação | x | indica o teto de 
x, OU seja, o menor inteiro m que satisfaz x = m. Da mesma forma, a notação | х indica o piso de 
x, OU Seja, o maior inteiro k que satisfaz k = x. 

Pode-se visualizar a execução do algoritmo merge-sort usando uma árvore binária T, cha- 
mada de drvore merge-sort. Cada nodo de T representa uma invocação recursiva (ou chamada) 
do algoritmo merge-sort. Associa-se com cada nodo v de T a segiiéncia 5 que é processada pela 
invocação associada com v. Os filhos do nodo v são associados com as chamadas recursivas que 
processam as subsegüências $, e 5, de S. Os nodos externos de T são associados com elementos 
individuais de 5, correspondendo a instâncias do algoritmo que não fazem chamadas recursivas. 

A Figura 11.1 resume uma execução do algoritmo merge-sort, mostrando as sequências de 
entrada с saída processadas em cada nodo da árvore merge-sort. A evolução passo a passo dessa 
árvore é apresentada nas Figuras 11.2 а 11.4. 

Esta visualização do algoritmo em termos da árvore merge-sort ajuda a analisar o tempo de 
execução do algoritmo merge-sort. Em especial, uma vez que o tamanho da sequência de entrada 


Ordenação, Conjuntos e Seleção 433 


é grosseiramente dividido pela metade a cada chamada recursiva do merge-sort, a altura da árvo- 
re merge-sor se aproxima de log n (lembre que a base de log é 2, se omitida). 
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Figura 11.1 Arvore merge-sort T para uma execução do algoritmo merge-sort em uma segtién- 
cia com $ elementos: (a) seqüéncia de entrada processada em cada nodo de T; (b) seqüéncia de 
saída geradas em cada nodo de T. 


Proposição 11.1 A drvore merge-sort associada com uma execução do merge-sort a partir de 
ита seqiiéncia de tamanho n tem altura [log nl 


A justificativa da Proposição 11.1 é deixada como um exercício simples (R-11.3). Esta pro- 
posição será usada para analisar o tempo de execução do algoritmo merge-sort. 

A partir de uma visão geral do merge-sor e da ilustração de seu funcionamento, vamos 
considerar cada um dos passos deste algoritmo de divisão e conquista em maiores detalhes, Os 
passos de divisão e recursáo do algoritmo merge-sort são simples; dividir uma sequência de ta- 
manho n envolve separá-la no elemento de ordem [ /2 | e as chamadas recursivas compreendem 
simplesmente passar essas sequências menores como parámetro. O passo difícil é o de conquista 
que faz a junção de duas sequências ordenadas em uma única. Conseqüentemente, antes de apre- 
sentar a análise do merge-sort, € necessário explicar melhor como isso é feito. 


11.1.2 Junção de arranjos e listas 


Para unir duas segliéncias ordenadas, é desejável conhecer se elas foram implementadas como ar- 
ranjos ou listas. Desta forma, nesta seção são apresentados detalhes do pseudocódigo descreven- 
do como unir duas sequências ordenadas representadas como arranjos e como listas encadeadas, 
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alce uius steek 


je) (D : 


Figura 11.2. Visualização de uma execução do merge-sort. Cada nodo da árvore representa 
uma chamada recursiva do merge-sort. Os nodos desenhados com linhas pontilhadas mostram 
chamadas que ainda não foram feitas. Os nodos desenhados com linhas grossas represen- 
tam as chamadas correntes. Os nodos vazios desenhados com linhas finas indicam chamadas 
completadas, Os nodos restantes (desenhados com linhas finas e que não estão vazios) repre- 
sentam chamadas que estão esperando pela invocação dos filhos para retornar. (Continua na 
Figura 11.3.) 
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Figura 11.4 Visualização de uma execução do merge-sort. Várias invocações são omitidas entre (T) 
e (m) e entre (m) e (n). Vide o passo da conquista no passo (p). (Continuação da Figura 11.3.) 


Unindo dois arranjos ordenados 


Inicia-se com a implementação com arranjo, apresentada no Trecho de código 11.1. Um passo 
em uma junção de dois arranjos ordenados é ilustrado na Figura 11.5. 


Algoritmo merge(s,, 5,, Sr 
Entrada: Seqüencias ordenadas 5, e $, e uma sequência vazia 5, todos implementados 
como arranjos, 
Saida: Sequência ordenada 5 contendo os elementos de $, e £. 
¡eje 
enquanto г < 5, size рер — 5,.size() faça 
se 5 get(i) = 5, деу) então 
$. addLast(5,.get( 1) (copia o i-nésimo elemento de $, para o final de 5} 
ii + | 
sendo 
5.addLast(5..get(j)) [copia o j-nésimo elemento de 5, para o final de 5] 
jej+i 
enquanto г = 5,.5ize() faça (copia os elementos restantes de 5, para 5} 
5.addL asti5,. peti) 
Det 1 
enquanto j < $size ) faça (copia os elementos restantes de $, para 5] 
$.addLast($,.get(j}) 
de Rol 
Trecho de código 11.1 Algoritmo para junção de dois arranjos ordenados baseados em seqüén- 
cias. 
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Figura 11.5 Um passo na junção de dois arranjos ordenados. São mostrados os arranjos antes 
do passo da cópia (a) e depois deste passo (b). 


Unindo duas sequências ordenadas 


O algoritmo merge, no Trecho de código 10.1, faz a junção de duas sequências ordenadas, 5, € 5, 
implementada como lista encadeada, A idéia principal é remover iterativamente o menor elemento 
das duas, acrescentando-o no final da sequência resultante, 5, até que uma das duas sequências 
esteja vazia, momento a partir do qual se copia o restante da outra sequência para a resultante 5. 
Um exemplo da execução desta versão do algoritmo merge é mostrado na Figura 11.6. 


Algoritmo merga(s,, 5.. Sr 
Entrada: Seqüéncias ordenadas 5, e 5. e uma segiléncia vazia 5, implementada como listas 
encadeadas. 
Saida: Sequência ordenada $ contendo os elementos de 5, e 5, 
enquanto 5, não estiver vazia e 5, não estiver vazia faça 
se 5, first |element() = 5S..first( J.element( ) então 
[move o primeiro elemento de 5, para o final de 5] 
S.addLast(5, remove, firsti ])) 
sento 
[move o primeiro elemento de 5, para o final de 5] 
5.addLast(5. removed. first(1)) 
[move os elementos restantes de 5, para 5] 
enquanto 5, não estiver vazia faça 
$.addLastí$,.remove(s,-first( 11) 
| move os elementos restantes de $, para 5] 
enquanto 5, não estiver vazia faça 
5. addLast(5..removea(5..firstí 11) 


Trecho de código 11.2 Algoritmo de merge para a junção de duas seqiiéncias ordenadas imple- 


mentadas como listas encadendas. 


Tempo de execução para a junção 


Analisa-se o tempo de execução do algoritmo merge para fazer algumas observações. Seja n, € 
н. o número de elementos de $, é S, respectivamente. O algontmo merge tem três laços while. 
Independente de se analisar a versão baseada em arranjo ou a versão baseada em lista, as opera- 
qões são executadas dentro de cada lago, e levam o tempo (Al) cada, A observação chave € que 
durante cada iteração de um dos laços, um elemento é copiado ou movido ou de $, ou 5, para 5 
(e que o elemento é considerado até o momento). Desde que inserções não são executadas em 
5, € 5,, esta observação implica que o número completo dos trés laços én, + n Desta forma, o 
tempo de execução do algoritmo merge é Ola, + naj. 
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Figura 11.6 Exemplo de uma execução do algoritmo de merge mostrado no Trecho de 
código 11.2. 


11.1.3 O tempo de execução do merge-sort 


Agora que se tém os detalhes do algoritmo merge-sort e analisou-se o tempo de execução do 
algoritmo decisivo, merge, usado na etapa de conquista, se examinará o tempo de execução do 
algoritmo merge-sort completo, considerando que é fornecida uma sequência de entrada com n 
elementos. Para facilitar, restringe-se a atenção ao caso em que m é potência de 2. Deixa-se um 
exercício (R-11.6) para mostrar que o resultado da análise também pode ser aplicado quando n 
não é potência de 2. 

Como foi feito na análise do algoritmo merge, assume-se que a sequência de entrada 5 c as 
sequências auxiliares 5, e $,, criadas рог cada chamada recursiva do merge-sort, são implemen- 
tadas ou com arranjos ou listas encadeadas (o mesmo que 5), assim a junção de duas sequências 
ordenadas podem ser feitas em um tempo linear. 
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Como se mencionou anteriormente, analisa-se a rotina merge-sort, referenciando a árvore 
merge-sort T. (Vide Figuras 11.2 a 11.4.) Chama-se o tempo gasto em um nodo v de T de tempo 
de execução de uma chamada recursiva associada com v, excluindo o tempo gasto esperando pe- 
las chamadas recursivas associadas com os filhos de v para terminar. Em outras palavras, o tempo 
gasto no nodo v inclui os tempos de execução dos passos de divisão e conquista, mas excluem os 
tempos de execução do passo de recursáo. Já se observou que os detalhes do passo de divisão são 
diretos; esse passo executa em tempo proporcional ao tamanho da seqüéncia v. Da mesma for- 
та, o passo de conquista, que consiste na junção de duas subseguências, consome tempo linear, 
independentemente de se estar usando arranjos ou listas encadeadas, Ou seja, fazendo i denotar 
a profundidade de um nodo v, o tempo gasto no nodo v é O(n/2), uma vez que o tamanho da 
sequência manipulada pelas chamadas recursivas associadas com v é igual à n/2. 

Examinando a árvore T de forma mais global, como mostrado na Figura 11.7, vê-se que, 
dada nossa definição de "tempo gasto em um nodo”, o tempo de execução do merge-son é igual 
à soma dos tempos gastos nos nodos de 7. Vide que Tem exatamente 2 nodos na profundidade i. 
Essa observação simples tem uma consequência importante, pois implica que o tempo total gasto 
em todos os nodos de T na profundidade i é OCZ - 117), o que corresponde a (Ma). Pela Proposi- 
ção 11.1, a altura de Té [og n | Portanto, uma vez que o tempo gasto em cada um dos [logn] + 
| niveis de Té Он), se terá o seguinte resultado: 


Proposição 11.2: O algoritmo merge-sort ordena uma segiiéncia de tamanho n em tempo 
On log n), assumindo que dois elementos de 5 podem ser comparados no tempo OCL. 


Em outras palavras, o algoritmo merge-sort combina assintoticamente o tempo mais rápido 
do algoritmo heap-sort. 


11.1.4. Implementagöes Java do merge-sort 


Nesta seção, são apresentadas duas implementações Java do algoritmo de merge-sort, um para 
listas e outro para arranjos. 


Uma implementação recursiva do merge-sort baseada em sequência 


No Trecho de código 11.3, mostra-se uma implementação completa em Java do algoritmo de 
merge-sor baseada em sequência com um método estático recursivo — mergerSort. Um compa- 
rador (ver Seção 8.1.2) é usado para decidir a ordem relativa dos dois elementos. 

Nesta implementação, à entrada é uma sequência L, e as listas auxiliares L1 e L2 são pro- 
cessadas pelas chamadas recursivas, Cada seqüéncia é modificada por inserções e remoções nos 
extremos da seqüéncia (head e tail) somente, conseqüentemente, cada alteração da sequência leva 
o tempo CN I), assumindo que as seguências são implementadas com listas duplamente encadeadas 
(ver Tabela 6,4), No nosso código, usa-se a classe NodeList (Trecho de código 6.9 - 6.11) para as 
sequências auxiliares. Assim, para uma lista L de tamanho n, o método mergeSort(L,c) executa mo 
tempo Gin log n) desde que a sequência L seja implementada com uma lista duplamente encadeada 
e o comparador c possa comparar dois elementos de L no tempo CN 1). 

Fer 


* Ordena 05 elementos da sequência em ordem não decrescente 

* de acordo com o comparador c, usando o algoritmo merge-sort 

hal À 

public static <E> vold mergeSort (PositionList<E=> in, Comparator--E- с) [ 
int n = In.sizei |; 
ifin — 2) 
return; // à seqüéncia já está ordenada 

// divide 
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Uma implementação não-recursiva baseada em arranjo do merge-sort 


Existe uma versão não recursiva do merge-sort baseada em arranjo, que executa no tempo On 
log n). Ele é, na prática, um pouco mais rápido que o merge-sort recursivo baseado em seqüén- 
cias, por ele evitar numerosas chamadas recursivas extras e criação de nodos, A idéia principal 
é executar o merge-sort de baixo para cima, executando as junções nivel a nível até realizar a 
junção para a árvore inteira. Dado um arranjo de elementos de entrada, inicia-se pela junção de 
todo par impar de elementos em execuções ordenadas de tamanho dois. Junta-se essas execuções 
em execuções de quatro, estas novas execuções são agrupadas em execuções de ouo е assim por 
diante, até que o arranjo esteja ordenado. Para manter o uso do espaço razoável, desenvolve-se 
um arranjo de saída que armazena as execuções de junção (trocando os arranjos de entrada e 
saída após cada iteração). Uma implementação em Java é apresentada no Trecho de código 11.4, 
onde se usa o método System.arraycopy para copiar um intervalo de células entre dois arranjos. 


pe Ordena um arranjo com um comparador usando um merge-sort nào recursivo, */ 
public static <E> void mergeSort(E[ ] orig, Comparator = E => c) ( 
E[] in = (El ]) new Object[orig length]; // cria um novo arranjo temporário 
System.arraycopyiorig,0,n,0,in. length); // copia a entrada 
El | out = (El ]) new Object[in.length]; // arranjo de saida 
E[ ] temp; // arranjo temporário referencia, usado para trocas 
int n = in.length; 
for (int i21; i = n; i*«2) { // cada iteração ordena todos executanto tamanho-2* | vezes 
for (int j20; | < n; j«z2*1) // cada iteração junta dois pares de tamanhos i 
merget(n,out,c.j.iy; // junta in e out 
temp = in; in = out; out = temp; // troca os arranjos para a próxima iteração 
} 
// o arranjo "in" contém o arranjo ordenado, assim ele será recopiado 
System .arraycopyin,0,orig,0,in.length); 
) 
/** Junta dois subarranjos, especificados por um início e incrementa. */ 
protected static <E> void merge(E[ ] in, E[ | out, Comparator<E> c, int start, 
int inc) [ // junta in[start..start-- inc- 1] e in[start + inc... start - 2*inc-1] 
int x = start; // indice para execução #1 
intendi = Math. minístart--inc, in.length); // limite para execução #1 
int end? = Math.min(start+2* inc, in.kengthy, // limite para execução #2 
int y = start«inc; // indice para execução #2 (poderia ser além do arranjo limite) 
int т = start; // Indice para o arranjo out 
while {x = end1) && (y < end2)) 
if (c.compare(in[x]in[y]) <= 0) out[z4] = in[x4-]; 
else out[z--«] = in[y++]; 
Wf (x < end1) // primeira execução não finaliza 
System arraycopy(in, x, out, 2, endi — xy; 
else if (y = end2) // segunda execução não finaliza 
systerm.arraycopylin, y, out, z, ende = yl 


Trecho de código 114 Uma implementação do algoritmo não-recursivo merge-sort. 


11.1.5 O merge-sort e suas relações de recorrência + 


Existe outra forma de justificar que o tempo de execução do algoritmo merge-sort é Oin log n) 
(Proposição 11.2). De fato, existe uma justificativa que lida de forma mais direta com a natureza 
recursiva do algoritmo merge-sort. Nesta seção, apresenta-se esta análise do tempo de execução 
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do merge-sort e, fazendo isso, o conceito matemático de equação de recorrência é introduzido 
(também conhecido como relação de recorrência). 

Faça a função rn) denotar o pior caso no que diz respeito ao tempo de execução do merge- 
sort a partir de uma sequência de entrada de tamanho л. Uma vez que o merge-sort € recursivo, 
pode-se caracterizar a função An) em termos das seguintes igualdades, onde a função п) é 
expressa recursivamente em termos de si mesma. Para simplificar nossa caracterização de дм), 
restringe-se a atenção ao caso onde m é uma potência de 2. (O problema de mostrar que a ca- 
racterização assintótica ainda permanece no caso geral ficará como um exercício.) Neste caso, 
pode-se especificar a definição de fn) como 


а) b sens | 
CO) 21(n/2)9en caso contrário 


Uma expressão como a apresentada anteriormente é chamada de equação de recorrência, 
uma vez que a função aparece tanto do lado esquerdo como do lado direito da igualdade. Apesar 
dessa caracterização ser correta e precisa, o que realmente se quer é uma caracterização mais 
evidente de in) que não envolva a própria função r(n), Ou seja, deseja-se uma caracterização de 
forma fechada para п). 

Pode-se obter uma solução forma fechada por meio da aplicação da definição de uma equa- 
ção de recorrência, assumindo que n é relativamente grande. Por exemplo, após um ou mais 
aplicações da equação acima, pode-se escrever uma nova recorrência para An) como 

Hn) = Mn) + (cn/2)) + en 
= Fan?) + Men?) + cn = 220027) + Zen. 


Se a equação for novamente aplicada, fn) = Er (nf?) + Zen. Neste ponto, deve-se ver um 
padrão surgindo, assim após aplicar esta equação i vezes oblem-se 
(п) = Fri) + ien. 
O ponto que resta, então, é determinar quando parar esse processo, Para determinar quando pa- 
rar, considera-se que se troca para a forma fechada fn) = b quando п = 1, o que irá ocorrer quando 
T = п. Em outras palavras, irá ocorrer quando i = log n. Procedendo essa substituição, tem-se 


= "t (n/2*") + (log men 
nml) + en log n 
= nb + en log n. 


Am) 


Isto é, obtemos uma justificativa alternativa para o fato de que л) é Ota log n). 


11.2  Quick-sort 


O próximo algoritmo de ordenação que será discutido é chamado de quick-sort. Da mesma forma 
que o merge-sort, este algoritmo também se haseia no paradigma de divisão e conquista, mas usa esta 
técnica de forma contrária, uma vez que o trabalho pesado é feito antes das chamadas recursivas. 


Descrevendo o quick-sort em alto nível 


O algoritmo quick-sort ordena uma seqüéncia 5 usando uma abordagem recursiva simples. A 
idéia principal é aplicar a técnica de divisão e conquista dividindo $ em subseqüéncias e aplican- 
do recursão para ordenar cada subseglência, para, então, combinar as subseqüéncias ordenadas 
por concatenação simples. Em detalhes, o algoritmo quick-sort consiste nos três passos seguintes 
(ver Figura 11.8): 
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= — 1 


1. Divisão: se 5 tiver pelo menos dois elementos (nada precisa ser feito se 5 tiver zero ou 
um elemento), escolhe-se um elemento x de 5, chamado de pivó. Normalmente, esco- 
Ihe-se como pivô x o último elemento de 5. Removem-se todos os elementos de 5 e eles 
são colocados em très seqiéncias: 


+ L armazenando os elementos de 5 menores que x; 
+ E, armazenando os elementos de $ iguais а x; 
+ G, armazenando os elementos de 5 maiores que x. 


Naturalmente, se os elementos de $ forem todos diferentes, então E armazena apenas 

um elemento, o próprio pivô, 

Recursão: ordenar as sequências Le G, recursivamente, 

3. Conquista: colocar de volta os elementos em 5 em ordem inserindo primeiro os ele- 
mentos de L, em seguida os de E e, por fim, os de C. 


ыз n2 


1. Divisão usando o piv x 


2 Recurso 3 Recurso 


3 Comentenação, 


Figura 11.8 Um esquema visual do algoritmo quick-sort, 


Da mesma forma que o merge-sort, a execução do quick-sort pode ser visualizada em termos 
de uma árvore binária recursiva chamada de drvore quick-sort, A Figura 11.9 resume a execução 
do algoritmo quick-sort mostrando as sequências de entrada e saída processadas em cada nodo 
da árvore quick-sort. À evolução passo a passo da árvore quick-sort é apresentada nas Figuras 
11.10, 11.11 e 11,12. 

Ao contrário do merge-sort, entretanto, a altura da árvore quick-sort associada com a execu- 
ção do quick-sort é linear no pior caso. 1550 acontece, por exemplo, quando a sequência consiste 
em n elementos distintos e já está ordenada. Na verdade, neste caso, a escolha padrão do maior 
elemento para pivô produz uma subseqiüéncia L de tamanho n = 1, enquanto a subsegquência E 
tem tamanho I e a subseqiéncia G tem tamanho 0, A cada invocação do quick-sort sobre a subse- 
quência L, o tamanho diminui em | unidade. Desta forma, a altura da árvore quick-sort é a — 1. 


Execução do quick-sort em arranjos e sequências 


No Trecho de código 11.5, apresenta-se a descrição de um pseudocódigo do algoritmo do quick - 
sort que é eficiente para sequências implementadas com arranjos ou listas encadeadas, O algo- 
ritmo segue o template do quick-sor apresentado acima, adicionando o detalhe da procura na 
sequência 5 de entrada iniciando no final para dividi-la nas sequências L, E e G de elementos que 
são respectivamente menores, iguais e maiores que o pivô. Executa-se esta varredura para trás, 
visto que remover o último elemento na sequência é uma operação de tempo constante indepen- 
dente se a sequéncia for implementada como um arranjo ou uma lista encadeada, Então recorre- 
se às sequências Le Cr e copia-se a sequência ordenada L, E e Cr de volta para 5. Executa-se este 
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último conjunto de cópias para frente, visto que inserir elementos no final da seqüéncia é uma 


operação de tempo constante independente se a sequência for implementada como um arranjo ou 
uma lista encadeada, 


Algoritmo QuickSaort( 5): 
Entrada: Uma sequência $ implementada como um arranjo ou lista encadeada. 
Saida: A sequência $ ordenada 
se Sage] = | entio 
Retorna [5 já está ordenada neste caso | 
p «— Slasti | element) [o pivó] 
seja L, E e G seqüéncias baseadas em listas 
enquanto !5.isEmpty() faça [rastrei 5 de trás para a frente, dividindo ela em L. Ec G} 
se Slasti elementi ) — p então 
L.addLast(5.remove(5.getLast( ))) 
sendo se 5.last( element) = p então 
E.addLast( 5.remove(S.getLast( ))) 
else [o último elemento de 5 é maior que p] 
(гад ав 5 removaiS.getLasti iyii 
QuickSort(L) [executa novamente com os elementos menores que p] 
QuickSortilr) [executa novamente com os elementos maiores que få] 
enquanto 'L.isEmptyt) faça [copia para o final de 5 os elementos ordenados menores que p] 


| 85 34 AA 45 17 31 Mm EL | 
[M E 
a en 
Pu ^m. 
[Г 4 45 п A! | 85 63 46 | 
e = Fi ч, —— m mi — 
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Р ы A ү ^ ы ч, 
|24 IT 45 | (BS 63 | 
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Figura 11.9 Árvore quick-sort T correspondente а uma execução do algoritmo quick-sort em 
uma sequência de 8 elementos: (a) sequências de entrada processadas em cada nodo de 75 (b) 
sequências de saída geradas em cada nodo de Т, O pivö usado em cada nível de recursáo é mos- 
trado em negrito, 
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S.addLast(L.removell. getFirst ))) 

enquanto !E isEmpty faça [copia para o final de 5 os elementos iguais a pl 
5.addLast( E.remove E getFirsti үр 

enquanto 16. isEmpty() faça [copia para o final de 5 os elementos ordenados maiores que p] 
5.addLast(C.remover(G.getFirst( ))) 

retorna [5 está agora ordenado | 


Trecho de código 11.5 Quick-sort para uma sequência de entrada 5 implementada com uma 
lista encadeada ou um arranjo. 


fes ER if) 


Figura 11.10 Visualização do quick-sort, Cada nodo da árvore representa uma chamada recursi- 
và. Os nodos desenhados com linhas pontilhadas indicam chamadas que ainda não foram feitas. Os 
nodos desenhados com linhas grossas mostram as invocações que ainda estão executando, Os nodos 
vazios desenhados com linhas finas representam chamadas encerradas. Os nodos restantes indicam 
chamadas suspensas (isto ё, invocações ativas que estão esperando pelo retorno de uma invocação 
filha). Observa-se os passos de divisão executados em (b), (d) e (0). (Continua na Figura 11.11.) 
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Figura 11.12 Visualização de uma execução do quick-sort. Várias invocações entre (p) e (q) 
foram omitidas. Observam-se os passos da conquista executados em (o) e (г). (Continuação da 
Figura 11.11.) 


completa. Da mesma forma, s, = m — 1, uma vez que o pivô não é propagado para o filho de r. 
Considere-se em seguida s,. Se os dois filhos de r tém tamanho de entrada diferente de zero, então 
5, = п — 3. Em qualquer outro caso (um filho da raiz tem tamanho zero, o outro tem tamanho a — 1), 
5,7 n — 2. Desta forma, s, = n — 2, Continuando esta linha de raciocínio, obtém-se que s, € m — i. 
Como observado na Seção 10,3, a altura de Tén — 1 no pior caso. Sendo assim, o pior caso para o 
tempo de execução do quick-sort € G(L 45, ) que é OEL - ij), o qual € OLEN, i), Pela Propo- 
sição 4.3, €" TE Ox). Assim, o quick-sort executa no pior caso no tempo Om’). 

Considerando o nome, pode-se esperar que o quick-sort execute de forma rápida. Entretanto, 
us limites quadráticos mostrados indicam que o quick-sort é lento no pior caso, Paradoxalmente, 
esse comportamento do pior caso ocorre em situações problemáticas em que a ordenação é sim- 
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ples - se a sequência já estiver ordenada. Além disso, pode-se mostrar que o quick-sort tem uma 
performance pobre, mesmo se а seqüencia estiver “quase” ordenada. 

Voltando à análise, observe que o melhor caso do quick-sort sobre uma sequência de elemen- 
tos distintos ocorre quando as subseqüéncias Le G têm, aproximadamente, o mesmo tamanho, 
Ou seja, no melhor caso tem-se 


4 = й 

44 = n-—1 

Ss = n=(l+*2)=n-=3 

у = n(1+24+2+-+2)=n- (2-1) 


Logo, no melhor caso, T tem altura O(log n) e o quick-sort executa em tempo Си log rm); 
deixa-se a justificativa deste fato para o Exercicio R-E1.11. 

A intuição informal por trás do comportamento esperado do quick-sort é que a cada invo- 
cação, provavelmente, o pivô irá dividir a sequência de entrada em partes mais ou menos iguais, 
Desta forma, espera-se que o tempo médio de execução do quick-sort seja semelhante ao tempo 
do melhor caso, ou seja, O(n log m. Na próxima seção, será mostrado que a introdução de rando- 
mização torna o comportamento do quick-sort exatamente o que acabou de ser descrito. 


11.2.1 Quick-sort randômico 


Uma forma normal de se analisar o quick-sort é supor que o pivô irá sempre dividir a sequência 
em partes quase iguais. Esta premissa, entretanto, pressupõe um conhecimento sobre a distribui- 
ção da entrada que normalmente não está disponível. Por exemplo, se terá de supor que raramen- 
te serão fornecidas sequências “quase” ordenadas рага pôr em ordem, o que pode ser comum em 
muitas aplicações. Por sorte, essa premissa não é necessária para se combinar nossa intuição com 
o comportamento do quick-sort. 

Em geral, deseja-se alguma forma de fechar com o melhor tempo de execução para o quick-sort, 
A forma de obter o tempo de execução para o melhor caso é claro, é para o pivô dividir igualmen- 
te a segiiéncia de entrada 5. Se este resultado era para ocorrer, então ele resultaria em um tempo 
de execução que é assintoticamente o mesmo que o tempo de execução do melhor caso. Isto é, 
tendo pivós posicionados no “meio” do conjunto de elementos conduz à um tempo de execução 
de Oin log п) para o quick-sort. 


Escolhendo pivôs randomicamente 


Uma vez que o objetivo do passo de divisão do método quick-sort é dividir a sequência 5 em par- 
tes quase iguais, se introduzirá a randomização no algoritmo e escolher como pivô um elemento 
randómico da sequência de entrada. Ou seja, em vez de escolher como pivó o último elemento de 
5, escolhe-se um elemento de 5 randomicamente para ser o pivô, mantendo o resto do algoritmo 
inalterado, Esta variação do quick-sort é chamada de quick-sort randomizado. А proposição а 
seguir mostra que o tempo esperado de execução do quick-sort randomizado em uma seqiéncia 
de л elementos é Oln log n). Esta explicação é tirada a partir de todas as possíveis combinações 
que o algoritmo pode fazer, e é independente de qualquer premissa sobre a distribuição das pos- 
siveis entradas que podem ser fornecidas para o algoritmo. 


Proposição 11.3: O rempo esperado de execução para o quick-sort randomizado aplicado em 
uma sequência de tamanho n é Mn log n). 


Justificativa Assume-se que dois elementos de $ podem ser comparados no tempo O( 1). Con- 
sidere-se agora uma invocação recursiva simples de um quick-sort randomizado, e Taça-se nt 
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denotar o tamanho da sequência de entrada para esta invocação. Diz-se que essa invocação é 
"boa" se о pivô escolhido for tal que as subseqüéncias L e G tenham tamanho no mínimo m/4 e 
no máximo 3m/4 cada; senão, a invocação é “ruim”, 

Agora, considerem-se as implicações da escolha de um pivô uniformemente de maneira 
randômica. Existem n/2 possibilidades de chances boas para que o pivô seja qualquer invocação 
de tamanho do algoritmo quick-sort randomizado. Assim, a probabilidade que qualquer chamada 
seja boa será de 50%. Nota-se após que uma boa chamada estará no mínimo em uma partição da 
sequência de tamanho n nas duas sequências de tamanhos 3n/4 e n/4, e uma chamada ruim pode- 
ria ser tão ruim como a produzida com uma chamada simples de tamanho n — 1. 

Considere-se agora uma execução recursiva para o quick-sort randomizado. Esta execução 
define uma árvore binária T, em que cada nodo de T corresponde a uma diferente chamada recur- 
siva de um subproblema de ordenação de uma porção da sequência original. 

Diz-se que um nodo v em T está em size group i se o tamanho do subproblema de v é maior 
que (3/4) e no máximo (3/4)'n. Analisa-se a seguir o esperado tempo gasto de trabalho em 
todos os subproblemas para s nodos no size group i. Pela linearidade da expectativa (Proposição 
A.19), o tempo de trabalho esperado de todos estes subproblemas é a soma dos tempos espera- 
dos de cada um. Alguns destes nodos correspondem a boas chamadas, e alguns correspondem 
a chamadas ruins. Porém, nota-se que uma chamada boa ocorre com probabilidade 1/2, e o 
número esperado de chamadas consecutivas que devem ser feitas antes de conseguir uma boa 
chamada é 2, Além disso, observa-se que assim que haja uma boa chamada para um nodo no 
size group i, seus filhos estarão em size groups maiores que i. Assim, para qualquer elemento x 
de uma seqüéncia de entrada, o número esperado de nodos no size group i contendo x em seus 
subproblemas é 2. Em outras palavras, o tamanho total esperado de todos os subproblemas no 
size group é é 2n. Visto que o trabalho não-recursivo que se executa para qualquer subproblema 
é proporcional ao seu tamanho, isso implica que o tempo total esperado gasto processando sub- 
problemas para nodos no size group i é On). 

O número de size groups é log, n, desde que repetidamente multiplicando por 3/4 é o 
mesmo que repetidamente por 4/3, Isto é, o número de size groups é log т). Então, o tempo 
de execução total esperado do quick-sori randomizado é O(n log n). (Ver Figura 11.13.) m 


Número de size Tempo esperado 
groups por size group 
f ^ size group 0 | 
| ours ene On) 


size group 1 
quM n) 


U Ga On! 
A 
^ * 
E ж 
А * 


Tempo total esperado: Ofn log n) 


Figura 11.13: Uma análise visual do tempo da árvore quick-sort T. Cada nodo é mostrado 
rotulado com o tamanho do seu subproblema. 
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comparado à sequência de tamanho s, por exemplo N = Ол) ou N = An log n). Ainda, sua 
performance se deteriora a medida que N cresce comparado a n. 

Uma propriedade importante do algoritmo bucket-sort é que ele trabalha corretamente mes- 
mo se existir muitos elementos diferentes com a mesma chave, Na verdade, ele é descrito de 
forma a antecipar tais ocorrências. 


Ordenação estável 


Ao ordenar itens chave-elemento, uma questão importante é como as chaves iguais são tratadas. 
Seja 5 = (ka e... (k, шпа segiiência de itens. Diz-se que um algoritmo de ordenação 
é estável se para quaisquer dois itens (k.e е (Ee) de 5, tal que k, = ke (К.е) precede (ke) em 
5 antes da ordenação (isto é, = $, e o item (k,e) também precede (ke) após a ordenação. A 
estabilidade é importante para um algoritmo de ordenação, porque as aplicações podem querer 
preservar a ordenação inicial dos elementos com a mesma chave. 

A descrição informal do bucket-sort no Trecho de código 11.8 não garante estabilidade. Esta 
não é inerente ao método bucket-sort propriamente dito, porém pode-se facilmente modificar a 
descrição para tornar o bucket-sort estável, 40 mesmo tempo em que se preserva seu tempo de exe- 
cução m + N}. Na verdade, pode-se obter um algoritmo bucket-sort estável removendo sempre o 
primeiro elemento da sequência $ e das sequências В|] durante a execução do algoritmo. 


11.4.2 Radix-sort 


Uma das razões pela qual a estabilidade de um algoritmo é importante é que ela permite que а 
abordagem do hucket-sort seja aplicada a contextos mais gerais do que a ordenação de inteiros. 
Supondo-se, por exemplo, que se quer ordenar itens que são pares (Жу, onde ke / são inteiros no 
intervalo [0, № — 1] para qualquer inteiro N = 2. Em um contexto como esse, é natural definir a 
ordenação desses itens usando a convenção lexicográfica (do dicionário), onde (kd) << (44,1) se 
Ко k ou sek = kel, « E (Segio 8.1.2). Esta é uma versão tal qual uma função lexicográfica 
de comparaç ão, normalmente aplicada em strings de caracteres de mesmo tamanho (e facilmente 
generalizável para tuplas de d números com d > 2). 

O algoritmo radir-sort ordena uma sequência de pares tais como 5, aplicando um bucket- 
sort estável sobre a sequência duas vezes, primeiro usando um componente do par como chave 
de ordenação e, em seguida, empregando o segundo componente. Mas qual é a ordem correta? 
Deve-se ordenar primeiro pelo & (o primeiro componente) e em seguida d (0 segundo componen- 
te) ou pode-se fazé-lo de outra forma? 

Antes de responder essa questão, vide o seguinte exemplo. 


Exemplo 11.5 Considere a seguinte sequência $: 
5 = ((03,3)141.5)42,5)40.2)4(2,3)41.7),(3.2)42.2). 
Ordenando 5 de forma estável no primeiro componente, então se obtém a seqiiéncio 
5, SL 1025302 IE. 
Ordenando, entáo, a segiiéncia $, usando o segundo componente, segne que 
$15 7 (0,2), 02,2), (3,2), (2,33, 03,3), (1,53, (2,3), (1, 79. 


que não é exatamente uma segiêncio ordenada. Por outro lado, se 5 for ordenado de forma está- 
vel usando o segundo componente, então se obtém a seguinte segilência 


5, = ((1,2), (3,2), (2,2), (3,3) (2,3), (1,35, (2,5), (1,79. 
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Ordenando, agora, de forma estável a segücncia S, usando o primeiro componente, obiém- 
se d segilência 


544 = (0,2). (1,5) (1,7), (2,2), (2,30, (2,5), (3,2), (3,3). 
que ё, de fam, uma sequéncia $ lexicograficamente ordenada. 


Então, a partir desse exemplo, se é levado a acreditar que é necessário primeiro ordenar 
usando o segundo componente e, então, ordenar novamente usando o primeiro. Esta intuição € 
correta. Ordenando de forma estável primeiro pelo segundo componente, e, então, novamente 
pelo primeiro, garante-se que se dois elementos forem iguais na segunda ordenação (pelo pri- 
mero elemento), então sua ordem relativa na sequência inicial (que é ordenada pelo segundo 
componente) será preservada. Sendo assim, a sequência resultante tem a garantia de ser ordenada 
lexicograficamente todas as vezes. Deixa-se рага um exercício simples (R- 10.14) a determinação 
sobre como esta abordagem pode ser estendida para triplas e outras d-tuplas de números. Esta 
seção pode ser resumida como segue: 


Proposição 11.6 Seja 5 uma sequência de n itens chave-elemento, cada um dos quais tendo uma 
chave (kk... а), onde k € um inteiro no intervalo [0,N — $] para qualquer inteiro № = 2 
Pode-se ordenar 5 lexicegraficamene em tempo Odin + NY, usando radix-sort. 


Apesar de ser tão importante, a ordenação não é o Único problema interessante que lida com 
relações de ordem total em um conjunto de elementos. Existem algumas aplicações, por exemplo, 
que não requerem a listagem ordenada e de um conjunto inteiro, mas necessitam de uma quantia de 
informação ordenada sobre o conjunto. Antes de estudar esse problema (chamado de “seleção”), € 
preciso retroceder e comparar brevemente todos os algoritmos de ordenação estudados até aqui. 


11.5 Comparando algoritmos de ordenação 


Neste ponto, pode ser útil fazer uma interrupção e analisar todos os algoritmos estudados neste 
livro para ordenar um arranjo, lista ou uma sequência de n elementos. 


Considerando tempo de execução e outros fatores 


vários métodos foram estudados, como a ordenação, o insertion sort e o selection sort, que tém 
comportamento temporal CO» na média e no pior caso. Também foram examinados vários mé- 
todos com comportamento temporal Arr log n incluindo heap sort, merge-sort e quick-sort. Fi- 
nalmente, uma classe especial de algoritmos de ordenação foi abordada, a saber, os métodos bu- 
cket-sort e radix-sort, que executam em tempo linear para certos tipos de chaves. Certamente, os 
algoritmos de ordenação da bolha e o selection sort são escolhas pobres em qualquer aplicação, 
uma vez que eles executam em tempo An’), mesmo no melhor caso. Mas entre os algoritmos de 
ordenação restantes, qual é o melhor? 

Como muitas coisas na vida, não existe claramente o “melhor” algoritmo de ordenação entre 
os candidatos restantes. O algoritmo de ordenação que melhor se aplica para um uso especifico 
depende das várias propriedades do mesmo. Pode-se, entretanto, oferecer algumas diretivas e 
observações, bascadas nas propriedades conhecidas de “bons” algoritmos de ordenação. 


Insert-sort 


Se bem implementado, o tempo de execução da insertion-20rt é Mn + m}, onde m é o número 
de Inversões (isto é, o número de pares de elementos fora de ordem). Sendo assim, o insertion 
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sort é um algoritmo excelente para ordenar pequenas sequências (por exemplo, com menos de 
50 elementos), porque é simples de programar e seglências pequenas necessariamente con- 
têm poucas inversões. Além disso, o insertion-sort, é bastante eficiente para ordenar sequências 
“quase” ordenadas. Por “quase”, entende-se que o número de inversões é pequeno. Mas a per- 
formance An’) em relação ao tempo do insertion-sort torna-o uma escolha pobre fora dessas 
situações especiais. 


Merge-sort 


Merge-sort, por outro lado, executa em tempo On log m) no pior caso, o que é ótimo para méto- 
dos de ordenação baseados em comparações. Além disso, estudos experimentais têm mostrado 
que, uma vez que é difícil fazer o merge-sort executar in-place, a carga de trabalho necessária 
para implementá-lo torna-o menos atrativo que as implementações in-place do heap sort e quick- 
sort para sequências que cabem inteiras na memória principal do computador. Desta forma, © 
merge-sort é um algoritmo excelente para situações em que a entrada não cabe toda na memória 
principal e tem de ser armazenada em blocos em um dispositivo de memória externa, como um 
disco. Neste contexto, a forma em que o merge-sort executa o processamento dos dados em gran- 
des cadeias faz melhor uso de todos os dados trazidos do disco para a memória principal. Assim, 
para ordenação em memória externa, o algoritmo merge-sort tende a minimizar o número total 
de acessos a disco para fazer a leitura ou à escrita necessárias, o que torna o algoritmo merge-sort 
superior neste contexto. 


Quick-sort 


Análises experimentais têm mostrado que se à sequência de entrada couber inteiramente na me- 
тпа principal, então as versões in-place do quick-sort e heap-sort executam mais rápido que o 
merge-sort. De fato, o quick-sort tende, na média, a ser melhor que o heap-sort messes testes. 

Então. o quick-sort é uma escolha excelente como algoritmo de ordenação de finalidades 
genéricas no uso em memoria. Na verdade, ele está incluido no utilitário qsort, fornecido nas 
bibliotecas da linguagem C. Entretanto, sua performance temporal Km) para o pior caso faz do 
quick-sort uma escolha pobre para aplicações de tempo real em que se tem de apresentar garan- 
tias sobre o tempo necessário para completar uma operação de ordenação. 


Heap-sort 


Em cenários de tempo real, nos quais se dispõe de um tempo fixo para executar uma operação 
de ordenação e os dados de entrada cabem na memória, o algoritmo heap-sort provavelmente é 
a melhor escolha. Ele executa em tempo Ön log л) no pior caso e pode ser facilmente adaptado 
para executar in-place. 


Bucket-sort e radix-sort 


Finalmente, se esta aplicação envolve ordenação por chaves inteiras ou d-tuplas de chaves intei- 
ras, então bucker-sort ou radix-sort são ótimas escolhas. pois executam em tempo Kain + NJ), 
onde [0, М — 1] € o intervalo de chaves inteiras (e d = 1 para o bucket-sort). Sendo assim, se 
din + N) está significativamente “abaixo” de n log n, então este método de ordenação pode 
executar mais rápido que o quick-sort ou o heap sort. 

Desta forma, o estudo sobre todos estes métodos diferentes proporciona a "caixa de ferra- 
mentas" para engenharia de algoritmos com uma coleção versátil de métodos de ordenação. 
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O método genérico de junção examina e compara iterativamente os elementos correntes a € 
b das sequências A e B, respectivamente, e determina quando a < b, a = b ou a > b. Então, ba- 
secado no resultado desta comparação, determina se pode copiar um ou nenhum dos elementos a e 
b para o fim da segiiéncia de saída C. Essa determinação é feita com base na operação especifica 
executada, seja união, interseção ou diferença. Por exemplo, na operação de unido procede-se 
como segue: 


+ Sea < b, copia-se a para o final de Ce avança-se para o próximo elemento de A. 
в Sea = b, copia-se 4 para o final de € e avanga-se para o próximo elemento de A e de B. 
* Sea > à copia-se b para o final de Ce avanga-se рага o próximo elemento de B. 


Desempenho da junção genérica 


Analisa-se o tempo de execução do algoritmo genérico de junção. À cada iteração, compara-se 
dois elementos das sequências de entrada A е B, possivelmente copiando um elemento рага а 
sequência de saída, e avançando o elemento atual de A, B ou ambos. Admitindo que as compara- 
¿des e cópias levem tempo GUN, o tempo total de execução é ln, + ngh onde mr, é o tamanho de 
A, en, é o tamanho de B; ou seja, a junção leva um tempo proporcional ao número de elementos 
envolvidos. Desta forma tem-se: 


Proposição 11.8: O TAD conjunto pode ser implementado usando um esquema de segiiéncia 
ordenada e junção genérico que suporta as operações union, intersect e subtract em tempo OX). 
onde n indica a soma dos tamanhos dos conpuntos envolvidos, 


Jungáo genérica usando o padráo do método modelo 


O algoritmo genérico de junção é baseado no padrão de método modelo (ver Seção 7.3.7). O 
padrão do método modelo é um padrão de projeto de engenharia de software que descreve um 
mecanismo genérico de computação que pode ser especializado pela redefinição de certos pas- 
sos, Neste caso, descreve-se um método que faz a junção de duas sequências em uma, e que pode 
ser especializado pelo comportamento de três métodos abstratos. 

O Trecho de código 11,9 apresenta a classe Merge provendo uma implementação em Java 
para o algoritmo de junção genérica. 


/** Junção genérica para sequências ordenadas. */ 
public abstract class Merge--E - | 
private E a, b; // elementos atuais em A e B 
private Iterator =E= iterA, iterB; if iterators para Ae B 
pe Método Template */ 
publie void merge(PositionList<E> A, PositionList<E> B, 
Comparator<E= comp, PositionList--E-- C) [ 
iterA = Aiteratorí |; 
iterB = B.iteratar( |; 
boolean aExists = advanceA(Y // Teste lógico se existe um atual a 
boolean bExists = advanceB[)y —//Teste lógico se existe um atual b 
while (aExists && bExists) f /! Laço principal para junção de a e b 
int x = comp.compare(a, bj; 
if (x < 0) [ alsLess(a, Ch aExists = advanceA( ); } 
else if (x == 011 
botháreEqualía, b, €), aExists = advanced): bExists = advance: | 
else | bisLess(b, C); bExists = advanceB( j; | 
} 
while (aExists) ( alsLessía, C); aExists = advanceA(); } 
while (bExists) { blsLessib, C); bExists = advanceB( }; | 
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Desempenho da implementação de sequência 


A implementação de sequência anteriormente apresentada é simples, porém ela também é efi- 
ciente, como pode ser visto no teorema que segue. 


Proposição 11.9: A execução de uma sério de n operações makeSet, union e find, usando a im- 
plementacdo anteriormente apresentada, iniciando a partir de uma partição inicialmente vazia 
leva o tempo Oin log n) 
Justificativa: Usa-se o método contabilizar e assume-se que um ciberdólar pode pagar pelo tem- 
po para executar a operação find, uma operação makeSet ou o movimento de uma posição de uma 
sequência para outra na operação union, No caso da operação makeSet ou find. define-se em 1 
ciberdólar cada uma. No caso da operação union, especifica-se em 1 ciberdólar para cada posição 
que se move de um conjunto para outro. Não se especificou para a operação union. Claramente, о 
total de gastos para as operações find e makeSet somados são Orr). 

Considere-se, então, o número de gastos criados para posições em nome da operação union. 
A importante observação é que cada vez que se move uma posição de um conjunto para outro, o 
tamanho do novo conjunto será pelo menos o dobro. Desta forma, cada posição é movida de um 
conjunto para outro no máximo log n vezes; então, cada posição pode ser definida no máximo 
com o tempo ilog n). Desde que seja assumido que a partição está inicialmente vazia, existem 
Kr diferentes elementos referenciados em uma dada série de operações, que implicam que o 
tempo total para todas as operações de união será Oin log n). " 


O tempo de execução amortizado de uma operação em uma série de operações makeSat, 
union e set, € o tempo total levado para as séries divididas pelo número de operações. Conclui-se, 
a partir da proposição apresentada anteriormente, que, para uma partição implementada usando 
sequências, o tempo de execução amortizado para cada operação será O(log п). Desta forma, 
pode-se resumir o desempenho da nossa simples implementação da partição baseada em seqüén- 
Cd COTO SEU, 


Proposição 11.10: Usando uma implementação baseada em segiiéncia de uma partição, em 
uma série de operações makeSet, union e find, iniciando a partir de uma partição inicialmente 
vazia, o tempe de execução amortizade para cada operação será ор н}. 


Nesta implementação baseada em seqúéncia de uma partição, cada operação find leva, no 
pior caso, o tempo de O(1). Isto é, o tempo de execução das operações union, que é o gargalo 
computacional, 

Na próxima seção, descreve-se uma implementação baseada em árvore de uma partição que 
nào garante o tempo constante das operações find, mas tem o tempo amortizado muito melhor 
que (log a} conforme a operação union. 


11.6.3 Uma implementação de partição baseada em árvore x 


Uma estrutura de dados alternativa usa uma coleção de árvores para armazenar п elementos no 
conjunto, onde cada árvore é associada com um diferente conjunto. (Ver Figura 11.17.) Em par- 
ticular, implementa-se cada árvore com uma estrutura de dados encadeada, em que os nodos são 
eles mesmos as posições do conjunto. Vê-se, ainda, cada posição p como sendo um nodo tendo 
uma variável, elemento, referindo an seu elemento x e uma variável, conjunto, referindo a um 
conjunto contendo x, como antes. Porém, agora também se vé cada posição p como sendo do tipo 
de dados “conjunto”. Assim, o conjunto referencia que cada posição p pode apontar para uma 
posição, que poderia ser о próprio p. Além disso, implementa-se esta abordagem em que todas as 
posições e seus respectivos conjuntos definem uma coleção de árvores. 
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Cada árvore é associada com um conjunto. Para qualquer posição p, se o conjunto de p re- 
ferencia pontos atrás de p, então p é a raiz desta árvore, e o nome do conjunto contendo p é "p" 
(isto É, neste caso se estaria usando nomes das posições como nome dos conjuntos). Fora isso, o 
conjunto referenciado рог p aponta рага o pai de p na sua árvore. Em ambos os casos, o conjunto 
contendo p é o associado com a raiz da árvore contendo p. 


Figura 11.17 Implementação baseada em árvore de uma partição consistindo de três conjuntos 
separados: А = (14,7), 8 = [2369] e C = (5,8.10,11,12). 


Com esta estrutura de dados de partição, a operação unioni A.B) é chamada com os argumen- 
tos de posições p € q, que respectivamente representam os conjuntos А e б (isto é A = pe — q) 
Execula-se esta operação criando uma das árvores como subárvore das outras (Figura 11.1896), 
que pode ser feito no tempo СКТ) pela definição da referência da raiz de uma árvore para apontar 
para a raiz da outra árvore. À operação find para uma posição p é executada caminhando para à 
raiz da árvore que contém a posição p (Figura 11.184), o que leva o tempo Oin) no pior caso. 

Esta representação de uma árvore é uma estrutura de dados especializada usada para imple- 
mentar uma partição, e isso não significa ser uma realização do tipo abstrato de dados árvore 
(Seção 7,1), Realmente, a representação tem somente conexões “para cima”, e não provê uma 
forma para acessar os filhos de um determinado nodo, 


Figura 11.18 Implementação de uma partição baseada em árvore: (a) operação union( AB); (b) 
operação find(p), onde p denota a posição do objeto para o elemento 12. 


Inicialmente, esta implementação pode não parecer melhor que a estrutura de dados baseado 
em sequência, porém, adiciona-se a seguinte heurística simples para fazer com que ele execute 
mais rápido: 
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Uniäo-pelo-tamanko: O tamanho da subárvore enraizada em p é armazenado com cada nodo 
posição p. Na operação union, cria-se a árvore do menor conjunto para se tomar uma subár- 
vore de outra árvore, e atualizar o campo tamanho da raiz da árvore resultante, 

Compressão de caminhos: Na operação find, para cada nodo v que a operação find visita, zera о 
apontador pai de v para a raiz. (Ver Figura 11.19.) 


Estas heurísticas incrementam o tempo de execução de uma operação em um fator constan- 
te; porém, como será discutido abaixo, elas melhoram significativamente o tempo de execução 
amortizado. 


(al 


Figura 11.19  Heuristica compressão de caminhos: (a) caminho cruzado pela operação find no 
elemento 12; (b) árvore reestruturada, 


O log-star e funções ackermann inversas 


Uma propriedade surpreendente da estrutura de dados partição bascada em árvore, quando im- 
plementada usando as heuristicas união-pelo-tamanho e compressão de caminhos, é que a exe- 
сисао de uma série de n operações union e find leva o tempo Ол log" n). onde log" s é a função 
log-star, o qual é o inverso da função tewer-of-two. Intuitivamente, log” n é o número de vezes 
que alguém pode, iterativamente, calcular o logaritmo (base 2) de um número antes de obter um 
número menor que 2. A Tabela 11.1 mostra alguns valores simples. 


mínimo n | 212=4|2=16 | 27 = 65,536 | 27 = 755-536 
dl 


log n | I 2 3 i 


Tabela 11.1 Alguns valores de log* n e valores críticos para os seus inversos. 


Como é demonstrado na Tabela 11.1, para todos os propósitos, log" n = 5, Ela é uma mara- 
vilhosa função de crescimento lento (porém é uma que cresce apesar de tudo). 

De fato, o tempo de execução de uma série de n operações de partição implementadas, como 
anteriormente mencionado, pode realmente ser apresentado para ser na), onde na é o inver- 
so da função de Ackermann, À. que cresce assintoticamente mais lenta que log" n. Entretanto, 
não será provado este fato; à função Ackermann será definida aqui para se apreciar justamente 
como ela cresce de forma rápida, e, então, como lentamente seus inversos crescem. Primeiro se 
definirá uma função Ackermann indexada, A como segue: 
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Adm) = 2n рага т = 0 
AD = Add) para é = | 
Alim = A (An — 1) praizlen=2 


Em outras palavras, as funções Ackermann definem uma progressão de funções, 


e Ain) = 2n é a função múltiplo de dois, 
+ An) = 2" а função potência de dois, 
e Aln) = £2 (com vários dois) é a função tower-of-twos, 


e e assim por diante, 
Então, define-se a função Ackermann como Aim) = A (л), que é uma inacreditável função 
de crescimento rápido. Da mesma forma, a função inversa Ackermann, 
cn) = minim: Alm) = m], 


é uma inacreditável função de crescimento lento. Ela cresce muito mais lentamente que a função 
log* n (a qual é a inversa da Am), por exemplo, e foi notado que log” п é uma função de cres- 
cimento muito lento. 


11.7 Seleção 


Existe uma grande quantidade de aplicações nas quais se está interessado em identificar um úni- 
co elemento em função de sua localização relativa à ordenação de um conjunto inteiro. Exemplos 
incluem a identificação do maior e do menor elemento, mas também pode-se estar interessado 
em, por exemplo, identificar o termo mediano, ou seja, o elemento tal que metade dos elementos 
seja menor que ele e a outra metade seja maior. Normalmente, consultas que questionam a res- 
peito da localização de um elemento são chamadas de estatísticas de ordem. 


Definindo o problema da seleção 


Nesta seção, será discutido o problema geral de estatística de ordem para selecionar o k-ésimo me- 
nor elemento de uma coleção não-ordenada de n elementos comparáveis. Isso é conhecido como o 
problema da seleção. É claro, pode-se resolver este problema ordenando a coleção, e então aces- 
sando a sequência ordenada na localização & = 1. Usando o melhor dos algoritmos de ordenação 
baseado em comparação, esta abordagem irá levar tempo O(n log л), o que é obviamente um ab- 
surdo nos casos em que k = | ou $ = n (ou mesmo k = 2, k= 3, k =n | ouk = n — 5) porque 
pode-se resolver o problema da seleção para estes valores de k, com facilidade, em tempo On). 
Logo, a questão que surge é como se pode obter um tempo de execução On) para todos os valores 
de k (incluindo o caso de encontrar o mediano, onde k = E "i 2. 


11.7.1 Poda e busca 


Pode ser uma pequena surpresa, mas, na verdade, pode-se solucionar o problema da seleção em 
tempo On) para qualquer valor de £. Além disso, a técnica que se usa para obter esse resultado 
envolve um interessante padrão de projeto de algoritmo. Este padrão de projeto é conhecido 
como poda e busca ou diminvição e conquista. Aplicando este padrão de projeto, resolve-se um 
problema que é defimido a partir de uma coleção de n objetos, podando uma fração destes e recur- 
sivamente resolvendo o problema menor. Quando se tiver finalmente reduzido o problema para 
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um problema definido sobre uma coleção constante de objetos, então é resolvido usando algum 
método de força bruta, Na medida em que se retorna das chamadas recursivas, a construção se 
completa. Em alguns casos, pode-se evitar o uso da recursão, caso em que simplesmente itera-se 
o passo de redução da poda e busca até que se possa aplicar um método de força bruta e parar. 
Incidentalmente, o método de pesquisa binária descrita na Seção 9.3.3 é um exemplo do padrão 
de projeto poda e busca, 


11.7.2 Quick-select randômico 


Aplicando-se o padrão poda e busca ao problema de seleção, pode-se projetar um método sim- 
ples e prático chamado de quick-select randomizado, para encontrar o k-ésimo menor elemento 
de uma seqüéncia não-ordenada de n elementos sobre os quais uma relação de ordem total é de- 
finda. O quick-select randomizado executa um tempo esperado Or), levando em conta todas as 
possíveis escolhas randómicas feitas pelo algoritma, е esta expectativa não depende de qualquer 
premissa sobre a distribuição de entrada. Observa-se que um quick-select randomizado executa 
em tempo Opri, no pior caso, a justificativa deste fato aparece em um exercício (R-1 1,25). 
Também se inclui um exercicio (0-11,31) que propõe modificar o quick-select para obter um 
algoritmo de seleção deterministico que execute em tempo Ca) no pior caso. Entretanto, a exis- 
téncia de um algoritmo deterministico é principalmente de interesse teórico, uma vez que o fator 
constante escondido pela notagáo O, neste caso, é relativamente grande. 

Suponha -se uma dada sequência não-ordenada 5 de n elementos comparáveis, juntamente 
com um inteiro É € [1.6]. No nível superior, o algoritmo quick-select para encontrar o k-ésimo 
elemento de 5 é similar em estrutura sò algoritmo quick-select randomizado descrito na Seção 
10.3.2. Pega-se um elemento x de $ randomicamente, para usar como “pivô” e subdividir 5 em 
trés subseqúéncias, L, E e Cr, armazenando os elementos de 5 menores que x, iguais a x e maiores 
que x, respectivamente. Este é o passo de poda. Então, baseado no valor de К, determina-se em 
quais destes conjuntos será aplicada a recursáo, O quick-select randomizado é descrito no Trecho 


de código 11.11. 
Algoritmo quickSelect(5 K ): 


Entrada: sequência $ de n elementos comparáveis e um inteiro £ € [1.1]. 
Saida: o k-ésimo menor elemento de 5. 
sen = | então 
retorna o (primeiro) elemento de $, 
seleciona um elemento aleatório x de 5 remove todos os elementos de 5 e coloca-os em trés 
zegene ras: 
+ L, armazenando os elementos de 5 menores que x; 
+ E, armazenando os elementos de 5 iguais a x; 
* Cr armazenando os elementos de $ maiores que x. 
se k = [L| então 


quickSelectL.E) 
sendo se É = |L| + |E] então 
retorna x [cada elemento em E é igual a x | 
sendo 
quickSelect(G.K — |L] — JE!) [observe o novo parámetro de seleção] 


Trecho de código 11.11 Algoritmo quick-select randomizado. 


Hidden page 


Hidden page 


R-11.15 


R-11.16 


R-11,17 


R-11.18 


R-11.19 


R-11.20 


R-11.21 


R-11.22 


R-11.23 


R-11.24 
R-11.25 


Criatividade 
C-11.1 


Ordenação, Conjuntos e Seleção 469 


caso, o algoritmo ordena corretamente a sequência de entrada, mas o resul- 
tado do passo de divisão pode diferir da descrição de alto nível dada na Se- 
ção 11.2 е pode resultar em ineficiência. Em particular, o que acontece no 
passo de partição quando existem elementos iguais ao pivó? A sequência E 
(armazenando os elementos iguais ao pivó) é realmente avaliada? O algo- 
ritmo usa as subsegüëncias L e R ou outras subsegiiéncias? Qual o tempo de 
execução do algoritmo se todos os elementos da entrada forem iguais? 


Sobre n! entradas possíveis para um dado algoritmo de ordenação baseado 
em comparação, qual é o número máximo absoluto de entradas que pode- 
riam ser ordenadas com somente п comparações”? 


Jonathan tem um algoritmo de ordenação baseado em comparação que or- 
dena os primeiros k elementos de uma seqüéncia de tamanho A no tempo 
On). Apresente uma caracterização O do maior valor que k pode conter? 
O algoritmo merge-sort da Seção 11.1 é estável? Justifique 

Um algoritmo que ordena itens chave-valor pela chave é chamado stra- 
geling se, a qualquer tempo, dois itens e, e e, tenham chaves iguais, mas e, 
aparece antes de e, na entrada, então o algoritmo coloca e, após e, na saida, 
Descreva uma alteração no algoritmo de merge-sort apresentado na Seção 
11.1 para torná-lo straggling. 


Descreva um método de radix-sort para ordenar lexicograficamente uma 
sequência 5 de triplas (A, É, m), onde k, Ге m sejam inteiros no intervalo 
[0, М — E para algum № = 2. Como o método pode ser estendido para se- 
quências de d-tuplas (£,, E... . a Ку), onde cada k é um inteiro no intervalo 
[0, № = 1]? 

O algoritmo de bucket-sort é in-place? Justifique. 

Apresente um exemplo de sequência de entrada que requer merge-sort e heap- 
sort para ter o tempo de ordenação Oin log a), porém executa uma inserção- 
ordenação no tempo Om). O que acontece se você reverter esta següëncia? 


Descreva, em pseudocódigo, como executar a compressão de caminho em 
um caminho de tamanho 4 no tempo CMA) em uma estrutura de partição 
union/find baseada em árvore. 


George afirma que ele tem uma forma rápida de fazer a compressão de cami- 
nho em uma estrutura de partição, iniciando no nodo +. Ele coloca v em uma 
sequência Le inicia seguindo os apontadores para os pais. Cada vez que ele 
encontra um novo nodo, ге, ele adiciona и em L е atualiza o apontador pal 
de cada nodo de £ para apontar рага о pai de u, Mostre que o algoritmo de 
George executa no tempo £N A) em um caminho de tamanho A. 


Descreva uma versão in-place do algoritmo quick-select com pseudo código, 


Mostre que o tempo de execução de pior caso do algoritmo de quick-select 
em uma sequência de n elementos é (Hin). 


Linda afirma ter um algoritmo que pega uma sequência 5 de entrada e pro- 
duz uma sequência T de saída que é uma ordenação de n elementos de $. 


a. Apresente um algoritmo, isSorted, para testar no tempo On) se T está 
ordenado, 


470 


Estruturas de Dados e Algoritmos em Java 


C-11.2 


C-11.3 


C-11.6 


C-11.7 


C-11.8 


C-11.9 


C-11.10 


h. Explique porque o algoritmo isSorted não é suficiente para provar que 
uma saída particular 7 do algoritmo de Linda é uma ordenação de 5. 

c. Descreva qual informação adicional o algoritmo de Linda poderia for- 
pecer para que a correção do seu algoritmo pudesse ser estabilizada em 
qualquer $ е 7 no tempo Cin). 

Dados dois conjuntos A е B representados como sequências ordenadas, 

descreva um algoritmo eficiente para realizar A © B, que € o conjunto de 

elementos que estão em A ou em B, mas não estão em ambos, 

Suponha que se representem conjuntos com árvores de pesquisa balancea- 

das, Descreva e analise algoritmos para cada método do TAD conjunto, 

assumindo que um dos dois conjuntos é muito menor que o outro, 


Descreva e analise um método eficiente para remover todas as duplicadas 
de uma coleção A de n elementos. 

Considere conjuntos cujos elementos inteiros no intervalo [0, N — 1]. Uma 
forma comum de representar um conjunto À desse tipo é através de um 
vetor booleano Ё, onde se diz que x está em À se e somente se B[x] = true. 
Como cada posição de В pode ser representada por um bit, В é às vezes 
chamado de vetor de bits, Descreva algoritmos eficientes para realizar os 
métodos para o TAD conjunto assumindo essa representação. 

Considere uma versão do quick-sort determinístico na qual pega-se como 
nosso pivô o mediano dos últimos d elementos na sequência de entrada 
de n elementos, para um fixo, constante número impar d = 3. Argumente 
informalmente por que este deverá ser uma boa escolha para o pivô. Qual é 
o assintótico tempo de execução do pior caso do quick-sort neste caso, em 
termos de n ed? 


Ошта forma para analisar o quick-sort randomizado é usar uma equação 
de recorrência. Neste caso, pega-se Tin) que denota o tempo de execução 
esperado do quick-sort randomizado e observa-se que, por causa das parti- 
ques do pior caso para as boas e ruins separações, pode-se escrever: 


| 
Tin) € — (Ti EN = In-4 bri 


bJ | = 


onde bn é o tempo necessário para separar uma sequência em relação à 
um dado pivô e contatenar as subseguências resultantes após o retorno das 
chamadas recursivas, Mostre, por indução, que Tín) é On log n). 
Modifique o algoritmo inPlaceQuickSort (Trecho de código 11.6) para tra- 
tar eficientemente o caso geral em que a sequência de entrada 5 pode ter 
chaves repetidas. 

Descreva uma versão não-recursiva e in-place do algoritmo de quick-sort. 
O algoritmo deve ser baseado na mesma estratégia de divisão e conquista, 
mas utiliza uma pilha explicita para processar subproblemas. Seu algoritmo 
deverá garantir que a profundidade da pilha seja no máximo Alog n). 
Mostre que o quick-sort randomizado executa no tempo Hr log n) com 
probabilidade no minimo | — Lin, isto é, com alta probabilidade, respon- 
dendo o seguinte: 


a. Para cada elemento de entrada x, defina C; (x) para ser uma variável 
randômica 0/1 que é 1 se e somente se o elemento x estiver em j + | 
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C-11.14 
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subprablemas que pertencem ao size group i. Discuta por que não preci- 
samos definir C, рага j > и. 


т 


Considere X, , uma variável randômica que € 1 com probabilidade EZ, 
independente de qualquer outro evento, e L = Dogs nl Discuta por que 
Е a 5, Заа Lx) = У E M n: i. pP 

c. Mostre que o valor esperado de Y pmo é(2 = IM. 

d. Mostre que a probabilidade de que X ^. tap A, PAL € no máximo 
Lin”. usando o limite de Chernoff, que expressa que se X é a soma de 
um número finito de variáveis randómicas WI independentes com valor 
esperado u > 0, entáo PAX > 25) < (He) ", onde e = 2,71828128.... 

e. Discuta por que a afirmação anterior prova que o quick-sort randomiza- 
do executa no tempo Oin log m com probabilidade no mínimo I — lin. 

Dado um arranjo A de a elementos com chaves iguais a О ou 1, descreva um 

método in-place para ordenar A sendo que todos os zeros fiquem antes de 

todos os uns. 


Suponha que temos uma sequência 5 de n elementos, de forma que cada 
elemento em 5 representa um voto diferente para líder estudantil, dado 
como um inteiro representando o número de matrícula do candidato es- 
colhido. Planeje um algoritmo de tempo On log n) para determinar quem 
vence a votação representada por $, supondo que o candidato com o maior 
número de votos será o escolhido (mesmo se existir O(n) candidatos). 
Considere o problema de votação do Exercício C-11.12, mas agora supo- 
nha que se conhece o número k < n de candidatos. Descreva um algoritmo 
de tempo O(n log k) para determinar quem vence a eleição, 

Considere o problema de votação do Exercício C-1 1.12, mas agora suponha 
que um candidato vence somente se conseguir a maioria dos votos compu- 
tados. Projete e analise um algoritmo rápido para determinar à vencedor se 
existir um. 

Mostre que qualquer algoritmo de ordenação baseado em comparações 
pode ser transformado em um método estável sem afetar o tempo de execu- 
ção assintótico do algoritmo. 


Suponha que temos duas segiiéncias А e B de n elementos cada, possivel- 
mente contendo repetições, nas quais existe uma relação de ordem total, 
Descreva um algoritmo eficiente para determinar se A e B contêm o mesmo 
conjunto de elementos, Qual o tempo de execução deste método? 


Dado um arranjo A de л inteiros de um intervalo [0, m — 1], descreva um 
método simples para a ordenação de À no tempo On). 

Sejam $p 5... -.. 5, següéncias diferentes k, cujos elementos têm chaves 
inteiras no intervalo (0, N — 1] para algum parámetro № = 2. Descreva um 
algoritmo com tempo Om + Му para ordenar todas as segiiéncias (sem fa- 
zer sua união), onde a denota o tamanho total de todas as sequências. 
Dada uma sequência 5 de a elementos onde existe uma relação de ordem 
total. Descreva um método eficiente para determinar se existem dois ele- 
mentos iguais em 5. Qual o tempo de execução de seu algoritmo? 

Seja $ uma sequência de n elementos em que está definida uma relação 
de ordem total. Uma inversão em 5 é um par de elementos x € y tais que x 
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algoritmo de Karen está correto e analise seu tempo de execução para um 
caminho de tamanho f. 

Este problema trata de uma modificação do algoritmo de quick-select para 
torná-lo determinístico e ainda podendo ser executado em tempo Cin) em 
uma seqüeéncia de a elementos. A idéia é modificar a forma com que se 
escolhe o pivô de modo que seja escolhido de forma deterministica, е nào 
aleatoriamente, como segue: 


Divida o conjunto 5 em | n/5 | grupos de tamanho $ cada (exceto, talvez, um 
grupo). Ordene cada pequeno conjunto e identifique a mediana do conjun- 
to. Com estas [1/5 | medianas “pequenas”, aplique o algoritmo de seleção 
recursivamente para encontrar à mediana das medianas “pequenas”. Use 
este elemento como pivó e continue como no algoritmo de quick-select. 


Mostre que este método deterministico tem tempo Ola}, respondendo as 
seguintes questões (ignore pisos e tetos se isto simplificar os cálculos, pois 
os resultados assintóticos continuam os mesmos): 

а. Quantas medianas pequenas são menores do que ou iguais ao pivô eseo- 
Ibido* Quantas são maiores ou iguais? 

b. Para cada mediana pequena menor ou igual ao pivô, quantos elemen- 
tos são menores ou iguais ao pivó? O mesmo é verdadeiro para aquelas 
maiores ou iguais ao pivô? 

c. Discuta por que o método para encontrar o pivô deterministicamente e 
usá-lo para particionar 5 custa tempo Om). 

d. Baseado nestas estimativas, escreva uma relação de recorréncia que limi- 
ta o tempo de execução de pior caso r (n) para este algoritmo de seleção. 
(Note que no pior caso há duas chamadas recursivas = uma para encon: 
trar a mediana das medianas pequenas e outra para fazer a recorréncia 
com o maior valor entre Le Ci.) 

, Usando essa relação de recorrência, mostre por indução que nmn) é On). 


e 


Experimentalmente, compare o desempenho do quick-sort in-place e uma 
versão de um quick-sort que não seja in-place. 

Projete e implemente uma versão estável do algoritmo de bucket-sort 
para ordenar uma sequência de n elementos com chaves inteiras no in- 
tervalo [0, № — 1] para N = 2, O algoritmo deve ser executado em tempo 
Mm + MI. 

Implemente o merge-sor e o quick-sort deterministico e realize testes para 
verificar qual dos dois é mais rápido. Seus testes devem incluir sequências que 
aparentemente são “aleatórias” e seqiiéncias que parecem “quase” ordenadas. 
Implemente o quick-sort determinístico e sua versão randomizada e realize 
testes para verificar qual dos dois é mais rápido. Seus testes devem incluir 
sequências que aparentemente são “aleatórias” e sequências que parecem 
“quase” ordenadas. 

implemente uma versão in-place do insertion-sort e uma versão in-place do 
quick-sort. Realize testes para determinar os valores de n para os quais © 
quick-sort é melhor (em média) do que o insertion-sort, 
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P-11.6 Projete e implemente uma animação para um dos algoritmos de ordenação 
apresentados neste capitulo. Sua animação deve ilustrar as propriedades 
essenciais do algoritmo de forma intuitiva. 

P-11.7 Implemente os algoritmos quick-sort randomizado e quick-select, e projete 
uma série de experimentos para testar suas velocidades relativas. 

P-11.8 Implemente um TAD para conjuntos estendidos, incluindo os métodos 
union( E), intersech А, size ) e isEmpty( ) mais os métodos equals( 5). 
containste). msertíe) c removal е). 

P-11.9 Implemente a estrutura de dados de partição union/find baseada em árvores 
com ambas as heurísticas: união-pelo-tamanho e compressão do caminho. 


Observações sobre o capítulo 


O clássico texto de Knuth Sorting and Searching [63] contém uma extensa história do problema 
da classificação e algoritmos para resolvê-lo. Huang e Langston [52] descrevem como unificar 
duas listas ordenadas de uma forma in-place e com tempo linear. Nosso TAD conjunto é derivado 
do TAD conjunto de Aho, Hoperoft e Ullman [5]. O algoritmo padrão para quick-sort foi feito 
por Hoare [49]. Uma análise mais profunda do quick-sort randomizado pode ser encontrada no 
livro de Motwani e Raghavan [79]. A análise do quick-sort apresentada neste capitulo é uma 
combinação de uma análise apresentada ne edição anterior deste livro, e a análise de Kleimberg 
е Tardos [59]. A análise do quick-sort do Exercício C-11.7 é devido a Littman. Gonnet e Baeza- 
Yates [41] fornecem comparações experimentais e análises teóricas de uma série de algoritmos 
diferentes de ordenação. O termo “poda e busca” é originário da literatura de geometria compu- 
tacional (como no livro de Clarkson [22] e Meggido [72,73]Y. O termo “diminuição e conquista" 
é de Levitin [68]. 
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12.1 


Operações com strings 


O processamento de documentos está se tornando rapidamente uma das funções dominantes 
dos computadores. Estes são usados para editar documentos, pesquisar documentos, transportar 
documentos pela Internet e apresentar documentos em telas e impressoras. Pesquisas na Web 
estão se tomando aplicações Importantes e significativas para os computadores, e muito do pro- 
cessamento essencial em todo este processamento de documentos envolve cadeias de caracteres 
e procura de padrões. Por exemplo, os formatos de documentos para Internet HTML e XML são 
primeiramente formatos de textos, com rótulos especiais adicionados para comportar conteúdo 
multimídia. Buscar o significado de muitos terabytes de informação na Internet requer um traba- 
lho considerável de processamento de texto, 

Além de ter aplicações interessantes, os tópicos deste capítulo também salientam alguns pä- 
drões de projeto importantes, Em particular, na seção sobre procura de padrões, será discutido o 
método da força bruta, que multas vezes é ineficiente, mas tem larga aplicação. Para compressão 
de textos, se estudará o método guloso, que frequentemente permite que sejam obtidas soluções 
aproximadas para problemas dificeis, e que, para alguns problemas (como na compressão de tex- 
tos), de fato, fornecem algoritmos ótimos. Finalmente, na discussão sobre similaridade de textos, se 
introduz a programação dinámica, que pode ser aplicada em instâncias especiais para resolver em 
tempo polinomial problemas que a princípio parecem requerer tempo exponencial para resolução. 


Processando texto 


No núcleo dos algoritmos para processamento de texto, estão métodos para lidar com cadeias de 
caracteres. Ás caderas de caracteres podem surgir de uma variedade de origens, incluindo aplicações 
científicas, lingúísticas e da Internet. De fato, abaixo temos exemplos destas cadeias de caracteres: 


P = "CGTAAACTGCTTTAATCAAACGC* 


à = "http://java.datastructures,net",. 


A primeira cadeia de caracteres, Р, tem origem em aplicações de pesquisa de DNA, enquanto 
a última cadeia de caracteres, 5, € o endereço (URL) do site da Web que acompanha este livro, 

Várias das operações típicas do processamento de cadeias de caracteres envolvem quebrar 
cadeias de caracteres longas em cadeias menores, Para poder falar dos pedaços que resultam 
deste tipo de operações, usa-se o termo substring de uma cadeia de caracteres P de comprimento 
m para se referir a uma cadeia da forma P[i]P[i + 1]--P[f] рагай == fj € m — |, ou seja. a 
cadeia formada pelos caracteres em Ё do indice i ao Índice у, inclusive. Tecnicamente, 1880 signi- 
fica que uma cadeia de caracteres é uma substring de si mesma (com i = (lej = m — 1), por isso, 
desejando-se excluir esta possibilidade, deve-se restringir a definição às substrings próprias, que 
requerem é > О ou j < m — I. 

Fara simplificar a notação de modo fazer referência às substrings, usa-se P[i..j] para denotar 
a substring de P do índice 7 an indice j, inclusive. Ou seja, 


P[i..j] = PIPE  1]--- Pp]. 


Usa-se à convenção de que se т > ү então Plig] é uma cadeia vazia, que tem comprimento 
(1. Além disso, para distinguir alguns casos especials de substrings, chama-se qualquer cadeia da 
forma РІО. para 0 = = m — 1 de prefixo de P e qualquer cadeia da forma P[j.m — 1] para O 
= = m — | de sufixo de P. Por exemplo, se P for a cadeia de DNA dada acima, então = CGTAA" 
é um prefixo de P, "CGC" é um sufixo de P e "TTAATO" é uma substring (própria) de P. Deve-se 
observar que uma cadeia vazia é prefixo e sufixo de qualquer outra cadeia. 

Para permitir noções gerais do modo correto de um caractere se chegar de uma string. tipi- 
camente não se restringe aos caracteres em Te P para explicitamente chegar a um conjunto bem 
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formado de caracteres, como o conjunto de caracteres Unicode. Em vez disso, usa-se o símbolo 
E para denotar o conjunto de caracteres, ou alfabeto, a partir de qual os caracteres podem vir. 
Desde que muitos algoritmos de processamento de documentos são usados em aplicações nas 
quais o conjunto de caracteres base é finito, usualmente assume-se que o tamanho do alfabeto E, 
denotado com [E], é uma constante. 

As operações sobre cadejas de caracteres são de dois tipos: aquelas que modificam uma 
cadeia e aquelas que simplesmente retornam informação sobre a cadeia, sem alterá-la, Java torna 
esta distinção precisa definindo a classe String, que representa as cadeias imutáveis, e a classe 
StringBuffer, que representa as cadeias mutdveis, ou que podem ser modificadas. 


12.1.1 Aclasse Java String 
As principais operações da classe String em Java sobre uma cadeia 5 são listadas abaixo: 
length(): Retorna o comprimento n de 5. Entrada: nenhuma, Saida: inteiro, 
charAt(iy Retoma o caractere na posição fem 5. 

startsWith((J:: Determina se Q é um prefixo de 5. 

endsWith(QY. Determina se Q é um sufixo de 5. 

substring(i;Y Retorna a substring 511.7]. 
concat(Q): Retoma a concatenação de Se Q,ou seja, $ + 0. 
equals(Q): Determina se Q é igual a 5. 

index0H 0) Se Q for uma substring de 5, retorna o índice da primeira ocorrência de 
( em 5, se não retorna — 1. 
Esta coleção forma as operações picas para cadeias imutáveis. 


Exemplo 12.1 Considere o seguinte conjunto de operações, que são executados na string 
5 = "abcdefghijklmnop": 


length( ) 
chart 5 | 


сопсац "ога" "abodefghijklimnopare + 


endsWith( "javapop*) false 
indexOf( "ghi*) 

startsWithf “abcd "| 
substrings, 9j i 


Com a exceção do método indexOf( Q). que será discutido na Seção 12.2, todos os métodos 
acima são facilmente implementados simplesmente representando a cadeia como um arranjo de 
caracteres, que é a implementação-padrão de uma String em Java. 


12.1.2 A classe Java StringBuffer 
As principais operações da classe StringBuffer em Java sobre uma cadeia 5 são listadas abaixo; 
append): Retorna 5 + €, substituindo $ por 5 + Q. 


insert(i.(J Retorna e atualiza $ inserindo ( em 5 na posição de índice i. 
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reverse |: Reverte e retorna a string 5. 
satCharAt(/ chr. Atualiza o caractere na posição i de 5, mudando-o para ch. 
сһагА г: Retorna o caractere na posição i de 5. 

Condições de erro ocorrem quando o item i está além dos limites da cadeia, Com a exce- 
ção do método charAt, a maioria dos métodos da classe String não são imediatamente disponi- 
veis a um objeto 5 da classe StringBuffer. Felizmente, a classe StringBuffer provê um método 
toString () que retorna uma versão String de 5, que pode ser usada para acessar os métodos da 
classe String. 

Exemplo 12,2 Considere o seguinte conjunto de operações realizadas sobre a cadeia mutável 


= "abcdefahijklmnop": 


Operação | NES. 


"abedefgh ijkimnopgrs " 


append( "ars" 
insert(.3, "xyz") "aboxyzdefghijklmnopgrs" 
reverse | "srgqponmlkjihgfedzyxcba" 
setCharAM 7, "W") "srgponmWkjihgfedzyxcba" 


12.2  Algoritmos para procura de padroes 


No problema clássico de procura de padróes em cadeias de caracteres, recebe-se uma cadeia de 
caracteres ou texto T, de comprimento n, e uma segunda cadeia ou padrão P, de comprimento 
m, e deseja-se saber se P é uma substring de T. Ou seja, deseja-se saber se existe uma substring 
de T iniciando na posição que confere com P caractere a caractere, de forma que 7]1] = P[ü], 
fir t 1] 2 PII... AE + m — 1] = P[m = 1], ou seja, P = Tii + m — 1]. Assim, a saída 
de um algoritmo de procura de padrões poderia ser uma indicação de que o padrão P não existe 
em T, ou um inteiro indicando a posição ou índice em T onde inicia uma cadeia igual a P. Este é 
exatamente o cálculo feito em Java pelo método indexOf na interface String. Alternativamente, 
pode-se desejar encontrar todos os índices em que uma substring de T seja igual a P. 

Nesta seção, serão apresentados trés algoritmos para procura de padrões (com niveis pro- 
gressivos de dificuldade). 


12.2.1 Força bruta 


O padrão de projeto algorítmico baseado em força bruta é uma técnica poderosa para o projeto 
de algoritmos quando se tem algo a procurar ou quando se deseja otimizar alguma função. Apli- 
cando esta técnica em uma situação genérica, tipicamente enumeram-se todas as possíveis confi- 
gurações das entradas envolvidas e escolhe-se a melhor das configurações enumeradas. 

Aplicando esta técnica para o algoritmo de procura de padrões por força bruta, deriva-se 
o que é provavelmente o primeiro algoritmo em que se pode pensar para resolver o problema da 
procura de padrões — simplesmente testam-se todas as possíveis colocações de P em relação a T. 
Este algoritmo, mostrado no Trecho de código 12.1, € bastante simples. 


Algoritmo BruteForceMatchiT, Py 
Entrado: as cadeias T (texto) com n caracteres e P (padrão) com m caracteres. 
Saida: o índice da primeira substring de T igual a Р, ou uma indicação de que P não é uma 
substring de 7. 


Hidden page 
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12.2.2. O algoritmo Boyer-Moore 


Pode-se pensar que é sempre necessário examinar cada caractere de T para localizar o padrão 
P como uma substring. Isso não acontece sempre, pois o algoritmo de procura de padrões 
Bover= Moore (BM), que se estudaráo nesta seção, consegue evitar comparações entre Pe uma 
boa parte dos caracteres em T. O único problema é que, enquanto o algoritmo de força bruta 
pode trabalhar com um alfabeto ilimitado, o algoritmo Boyer-Moore assume que o alfabeto 
tem tamanho finito. Ele tem melhor desempenho quando o alfabeto é de tamanho moderado e 
o padrão é relativamente longo, Assim, o algoritmo BM é ideal para procurar palavras em do- 
cumentos. Nesta seção, será descrita uma versão simplificada do algoritmo original de Boyer- 
Moore. 

A idéia principal do algoritmo BM é melhorar o tempo de execução do algoritmo de força 
bruta adicionando a ele duas heuristicas que potencialmente podem economizar tempo. Basica- 
mente, essas heurísticas são as seguintes: 


Heurística do espelho: quando se testa uma possível colocação de P em T, começa-se as compa- 
rações de forma invertida, ou seja, pelo final de P, e recua-se até o início de P; 

Heuristica do salto de caracteres: durante o teste de uma possivel colocação de P em T, uma di- 
ferenga entre o caractere T|] = c com o caractere correspondente | é tratada como segue: 
se c nào está contido em lugar algum de Р, então move-se P completamente para depois 
de 71i] (pois Tl] nào pode estar em P. Caso contrário, move-se P para frente até que uma 
ocorrência do caractere c em P esteja alinhada com 7Ti]. 


Estas heurísticas serão formalizadas em breve, mas de forma intuitiva pode-se perceber que 
elas trabalham de forma integrada. A heurística do espelho permite que a segunda heurística 
evite comparações entre P e grupos inteiros de caracteres em T. Neste caso, ао menos, pode-se 
chegar ao resultado mais depressa indo de trás para frente, pois se encontra uma diferença entre 
caracteres quando se procura P em uma certa posição de T, então provavelmente se evita uma 
série de comparações desnecessárias movendo P de forma significativa em relação a T através da 
heurística do salto de caracteres, À heuristica do salto de caracteres traz grande vantagem se for 
aplicada cedo no teste de ocomência de P em T. 

Define-se agora como а heurística do salto de caracteres pode ser integrada em um algoritmo 
de procura de padrões em cadeias de caracteres. Para implementar essa heurística, define-se uma 
função last(c) que recebe um caractere c do alfabeto e caracteriza o quanto é possível avançar о 
padrão P se um caractere igual a c for encontrado no texto е não fizer parte do padrão. Em parti- 
cular, define-se last(c) como 


ж Sec esti em P, lastúch é o indice da última ocorrência (mais à direta) de c em P. Senão, 
convenciona-se que lastíc) l. 


Se os caracteres podem ser usados como indices em arranjos, então a função last pode ser 
implementada facilmente como uma tabela, Deixa-se o método de construção desta tabela em 
tempo Om + [El dado P, como um simples exercício (R- 12.6). Essa função last fornece toda a 
informação de que se precisa para realizar a heurística do salto de caracteres. 

No Trecho de código 12.2. mostra-se o algoritme Boyer-Moore para procura de padrões. 


Algoritmo BMMatchi T.P1: 
Entrada: as cadeias T (texto) com m caracteres e P (padrão) com m caracteres. 
Saida: o indice da primeira substring de T igual a P, ou uma indicação de que P não é uma 
substring de T. 
calcular a função last 
Pem-l 
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ет — | 
repita 
se РЕ = Tl] então 
se j = Dentáo 
retorna ѓ lachado!] 
senão 
iei | 
j=j] 
sendo 
Pe E m — mind + lasti Tiili) [ salto | 
j*-m-—1 
atéi=n—| 
retorna “Não existe substring em T igual a Р.” 


Trecho de código 12.2 O algoritmo de procura de padrões Boyer-Moore. 


O passo do salto é ilustrado na Figura 12.2. 


(ad 
I 
I 
h | ü | 
(b) i 
4 pl 
= = 


Figura 12.2. Tustração do passo de salto no algoritmo BM (veja o Trecho de código 12.2), onde 
usa-se a notação 1 = азі). Diferenciam-se dois casos: (a) 1 + | = j, onde se move o padrão 
j— i unidades; (b) j < 1 + |, onde se move o padrão uma unidade 


A Figura 12.3 ilustra a execução do algoritmo Boyer- Moore em uma entrada similar à do 
Exemplo 12,4. 

A correção do algoritmo BM para procura de padrões vem do fato de que, a cada vez que o 
método move o padrão, é garantido que ele não “pula” sobre um possível acerto, [sso acontece 
porque lastíc) é о local da diima ocorrência de c em Р. 

O tempo de execução de pior caso do algoritmo BM é Om + [X]. O cálculo da função last 
custa tempo Olm + |El) e a procura pelo padrão custa tempo Oun) no pior caso, o mesmo que o 
algoritmo de força bruta. Um exemplo de par texto/padráo que atinge o pior tempo € 

A 


acia n v 


T 


mim] 
HU, 


P = baaa 
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popogi de 
1 


4 3 2 14 12 11 W B в 


La [o [a Въ a [eTaTe [ao 
E] 7 
а [Баје ја ы Пин 
б 
а 18 [а е ја fã 


А Tunçãolast(c) 
г a h c d 
last(c) | 5 3 =l 


Figura 12.3 Uma ilustração do algoritmo BM para procura de padrões. O algoritmo realiza 13 
comparações entre caracteres, que são indicadas pela numeração. 


O pior desempenho, no entanto, é dificil de ser obtido com texto em língua inglesa, Neste 
caso, o algoritmo BM é frequentemente habilitado para saltar grandes porções do texto. (Ver 
Figura 12.4.) Evidência experimental no texto em inglés mostra que o número médio de compa- 
rações feitas por caractere é 0,24 para uma cadeia padrão de 5 caracteres, 


E, n 
E 


1 3 5 
пип ооо пип 
2 4 E E 

(or fi fe [а fm efa fe |h fm poogin 


Figura 12.4 Um exemplo de uma execução do algoritmo Boyer-Moore em um texto em inglés, 


11 10р 3 8 7 


Uma implementação em Java do algoritmo BM para procura de padrões é mostrada no Tre- 
cho de código 12.3. 


/** Versão simplificada do algoritmo Boyer-Moore (BM), que usa apenas as 
* heuristicas do espelho e do salto de caracteres. 
+ @return Índice do começo da ocorrência mais à esquerda do texto igual ao 
+ padrão, ou -1 se não há tal ocorrência */ 
public static int BMmatch (String text, String pattern) { 
int[ ] last = buildLastFunction(pattern); 
int n = text.length( |; 
int m = pattern. length( |; 


inti = m — 1; 
if —n- 1) 
return — 1; // пао há ocorrências se o padrão é mais longo do que o texto 
int jz m = 1; 
do | 
if (pattemn.charAt(j) == text.charAt()) 
if (== 0) 


return i; // achado 
else [// heuristica do espelho: do fim para o inicio 
ї— =; 


copyrighted material 
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else { // heurística do salto de caracteres 
i=i+m — Math.min(j, 1 + last[text charAt( Е 
jam 1; 
] 
} while (i <= n — 1); 
return — 1; // não foi achado 


} 
public static int[ | buildLastFunction (String pattern) { 


int[ ] last = new int[128]; // assume-se o conjunto de caracteres ASCII 
for (inti=0;1< 128; 1++) 4 
last[ i] = —1; // inicializa-se o arranjo 
} 
for linti = 0; 1 =< pattern lengthi Y; i++) { 
last[pattern.charAt( i )] = i; // conversão para um código ASCII inteiro 


} 
return last; 


Trecho de código 12.3 Implementação em Java do algoritmo BM para procura de padrões. O 
algoritmo é expresso por dois métodos estáticos: o método BMmatch realiza a procura por pa- 
drões e chama o método auxiliar buildLastFunction para calcular à função last, expressa por um 
arranjo indexado pelo código ASCII do caractere, O método BMmatch indica a ausência de uma 
ocorréncia retomando o valor convencional — 1. 


Na realidade, é apresentada uma versão simplificada do algoritmo Boyer-Moore (BM). O 
algoritmo BM original tem um desempenho Or + m + [Elk usando uma heurística alternativa 
de saltos à frente até o texto já parcialmente encontrado, sempre que ele avança o padrão mais do 
que a heurística de salto de caracteres apresentada aqui. Esta heurística alternativa para o salto à 
frente é baseada na aplicação da idéia principal do algoritmo Knuth-Morris-Pratt de procura de 
padrões, que será discutido a seguir. 


12.2.3 O algoritmo de Knuth-Morris-Pratt 


Estudando o desempenho de pior caso dos algoritmos de força bruta e Boyer-Moore em instán- 
cias específicas do problema, como a mostrada no Exemplo 12.3, nota-se uma fonte de ineficiên- 
cia. Especificamente, pode-se realizar muitas comparações enquanto se testa um posicionamento 
do padrão sobre o texto, mas descobrindo-se um caractere do padrão que falha nesta comparação, 
então se joga fora toda a informação adquirida pelas comparações anteriores e começa-se nova- 
mente (do zero) no ponto em que o padrão for posicionado, mais à frente. O algoritmo Knuth- 
Morris-Pratt (KMP), discutido nesta seção, evita este desperdício de informação e, ao fazer isso, 
atinge um tempo de execução de Oin + m), que € ótimo no pior caso. Ou seja, no pior caso qual- 
quer algoritmo de procura de padrões terá de examinar todos os caracteres do texto e do padrão 
ao menos uma vez. 


A função de falha 


A idéia principal do algoritmo KMP é pré-processar P para calcular uma função de falha f. que 
indica o quanto se deve avançar P de forma que seja possível reutilizar as comparações realizadas 
anteriormente tanto quanto possível, Especificamente, a função de falha fij) é definida como o 
comprimento do prefixo mais longo de A, que é um sufixo de P]1..¡] (deve-se observar que não 
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Figura 12.5 Ilustragäo do algoritmo de procura de padrões Knuth-Morris-Pratt. A função de 
falha f para este padrão é dada no Exemplo 12.4. О algoritmo realiza 19 comparações de carac- 
teres, indicadas pela numeração. 


Desempenho 


Excluindo o cálculo da função de falha, o tempo de execução do algoritmo Knuth-Morris-Pratt € 
certamente proporcional ao número de iterações do laço enquanto. Para a análise, irá-se definir 
& = i — j. Intuitivamente, К é o total de avanço do padrão Р em relação a T. Vide que em toda a 
execução do algoritmo tem-se k = л. Um dos trés casos abaixo ocorre a cada iteração do laco. 


e Se Mi] = P[j]. então i aumenta em I e X nào se altera, pois | também aumenta em 1. 

e Se fli + РД ej > 0, então i não se altera е k aumenta em pelo menos 1, pois neste caso 
k muda de i — J para é — fj — 1). que é maior do que у — fij — 1), que é positivo porque 
fy hej 


* Se Ti] + P[j] ej = 0, então г aumenta em | e k aumenta em 1, pois у nào se altera. 


Assim, a cada iteração do laço tem-se que i ou k aumentam em ao menos 1 (possivelmente os 
dois), portanto o número total de iterações do laço enquanto no algoritmo KMP é de no máximo 
2n. Atingir este número, é claro, pressupõe que a função de falha para P já foi calculada. 


Construindo a função de falha KMP 


Para construir a função de falha, usa-se o método mostrado no Trecho de código 12.5, que é 
um processo semelhante ao algoritmo KMPmatch. Compara-se o padrão a si mesmo como no 
algoritmo KMP. A cada vez que se tem dois caracteres iguais, faz-se fli) =] + 1. Vide que como 
se tem é > j em toda a execução do algoritmo, fj — 1) está sempre definida quando é preciso 
usá-la. 


Algoritmo KMPFailureFunction(P): 
Entrada: o padrão P, com m caracteres. 
Saída: a função de falha / para P, mapeando j para o comprimento do mais longo prefixo 
de P que é um sufixo de P[1..j]. 
iel 
ж 0 
A0) — 0 
enquanto ; = m faça 
se РІЛ = Р] então 
[já foram achados | + | caracteres] 
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else if (| > 0) // | seguem um prefixo que serve 
і = fail[j - 1]; 

else [ // nào foi achado 
faili i | = С 
і++; 

] 


| 
return fail; 


i 


Trecho de código 12.6 Implementação em Java do algoritmo Knuth-Morris-Pratt para procura 
de padrões, O algoritmo é expresso por dois métodos estáticos: o método KMPmatch realiza 
a procura é chama o método auxiliar computeFailFunction para calcular a função de falha, ar- 
mazenada em um arranjo. O método KMPmatch indica a falha na procura retomando o valor 
convencional — 1. 


12.3 Tries 


Os algoritmos de procura de padrões apresentados na seção anterior aceleram a procura em um 
texto, pré-processando o padrão (para calcular a função de falha no algoritme KMP ou à função 
last no algoritmo BM). Nesta seção, será usada uma abordagem complementar, ou seja, serão 
apresentados algoritmos de procura que pré-processam o texto. Esta abordagem é adequada para 
aplicações em que uma séne de consultas é realizada em um texto fixo, de forma que o custo ini- 
cial de pré-processar o texto é compensado pela aceleração das consultas seguintes (por exemplo, 
um site na Web que oferece consultas a Hamer ou um mecanismo de busca que oferece páginas 
da Web sabre o tópico Hamlet). 

Um trie é uma estrutura de dados baseada em árvore para armazenar cadeias de caracteres 
e suportar uma rápida procura de padrões. À aplicação principal dos tries é na recuperação de 
informação. De fato, o nome “trie” vem da palavra "retrieval" (recuperação). Em uma aplicação 
de recuperação de informação, como a procura por uma segiiência de DNA em uma base de 
genomas, tem-se uma coleção 5 de cadeias de caracteres definidas usando-se o mesmo alfabeto. 
As operações primárias de consulta suportadas por tries são procura de padrões e procura de 
prefixos. ^ última operação envolve receber uma cadeia X e determinar todas as cadeias em 5 
que tém X como prefixo. 


12.3.1 Tries-padráo 


Seja 5 um conjunto de x cadeias de caracteres do alfabeto E, de forma que nenhuma cadeia de 5 
seja um prefixo de outra cadeia. Um trie-padráo para 5 é uma árvore ordenada T com as proprie- 
dades seguintes (ver Figura 12.6): 


* Cada nodo de T, exceto a raiz, é rotulado com um caractere de E. 

* A ordem dos filhos de um nodo interno em T € determinada por uma ordenação canônica 
do alfabeto E, 

+ Tiems nodos externos, cada um associado com uma cadeia de $ de tal forma que a con- 
catenação dos rótulos dos nodos no caminho da raiz até um nodo externo v de T resulta na 
cadeia de $ associada com v. 


Assim, um trie T representa as cadeias de 5 em caminhos da raiz até os nodos externos de 
T. Observa-se a importância de assumir que nenhuma cadeia de 5 é prefixo de outra cadeia, pois 
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isso garante que toda cadeia seja unicamente associada a um nodo externo de T. Pode-se sempre 
satisfazer essa exigência adicionando um caractere especial que não se encontra no alfabeto X ao 
final de uma cadeia. 

Um nodo interno em um trie-padráo T pode ter entre | e d filhos, onde d é o tamanho do alfa- 
beto. Existe uma aresta indo da raiz r até um de seus filhos para cada caractere em primeiro lugar 
em alguma cadeia na coleção 5, Adicionalmente, um caminho da raiz de T para um nodo interno 
v com profundidade i corresponde a um prefixo X]0..i — 1] com i caracteres de uma cadeia X 
em 5, De fato, para cada caractere c que pode seguir o prefixo X[U..; — 1] em uma cadeia de 5, 
existe um filho de v rotulado com o caractere c. Desta forma, um trie armazena concisamente os 
prefixos comuns que existem em um conjunto de caderas, 


Figure 12.6 Trie-padräo para as strings [bear, Bell. bid, Bull, buy, sell, stock, stop]. 


Se existem somente dois caracteres no alfabeto, então o trie é essencialmente uma árvore 
binária, embora alguns nodos internos possam ter somente um filho (ou seja, pode ser uma árvore 
binária imprópria). Em geral, se existem dl caracteres no alfabeto, então o trie será uma árvore 
múltipla em que cada nodo interno tem de 1 a d filhos. Além disso, é provável que existam vários 
nodos internos em T que tenham menos do que d filhos, Por exemplo, o trie mostrado na Figura 
12.6 tem vários nodos internos com apenas um filho. É possível implementar um trie com uma 
árvore armazenando caracteres em seus nodos. 

A proposição a seguir descreve algumas propriedades estruturais importantes de um trie- 
padrão: 

Proposição 12.8 Um trie-padráo que armazena uma coleção 5 de cadeia de caracteres de 


comprimento total n com um alfabeto de tamanho d tem as seguintes propriedades: 


Todo nodo interno de T tem no máximo d filhos. 

T tem s nodos externos. 

А altura de Té igual ao comprimento da maior cadeia em 5. 
O número de nodos em Té O(n). 


O pior caso para o número de nodos de um tric ocorre quando nenhum par de cadeias com- 
partilha um prefixo, ou seja, exceto pela raiz, todos os nodos internos têm um filho, 

Um trie T para um conjunto $ de cadeias de caracteres pode ser usado para implementar um 
dicionário cujas chaves são as cadeias de 5, Realiza-se uma procura por uma cadeia X em T ini- 
ciando na raiz e seguindo os caracteres de X. Se este caminho puder ser traçado e terminar em um 
nodo externo, então X está no dicionário. Por exemplo, o trie da Figura 12.6, traçando o caminho 
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para “bull”, termina em um nodo externo. Se o caminho não puder ser traçado ou não terminar 
em um nodo externo, então X nào está no dicionário. No exemplo da Figura 12.6, o caminho para 
“bet” não pode ser traçado, e o caminho para “be” termina em um nodo interno. Nenhuma dessas 
palavras está no dicionário. Deve-se observar que nessa implementação de um dicionário, são 
comparados caracteres isolados, em vez de toda a cadeia (chave). É fácil perceber que o tempo 
de execução рага a procura de uma cadeia de comprimento m é Oídm), onde d € о tamanho do 
alfabeto. De fato, visitam-se no máximo m + 1 nodos de Pe gasta-se tempo (Hd) em cada nodo. 
Para alguns alfabetos, é possível melhorar o tempo gasto em um nodo рага O(1) ou Ойор d) 
usando um dicionário de caracteres implementado com um tabela hash ou ошто про de tabela. 
Entretanto, já que d é uma constante na maior parte das aplicações, pode-se usar uma abordagem 
mais simples, que usa tempo Od} por nodo visitado, 

Da discussão anterior, conclui-se que se pode usar um trie para realizar um tipo especial de 
procura de padrões, chamado de procura de palavra, no qual se deseja determinar se um dado 
padräo é exatamente igual a uma das palavras do texto. (Ver Figura 12.7.) A procura de palavras 
difere da procura de padrões comum. já que o padrão não pode ser igual a uma substring arbitrá- 
na do texto, mas a apenas uma de suas palavras. Usando um trie, a procura de palavras para um 
padrão de comprimento m custa tempo Ha), onde d € o tamanho do alfabeto, independente- 
mente do tamanho do texto. Se o alfabeto tem tamanho constante (como é o caso para linguagens 
naturais e para DNA), uma consulta custa tempo Ch m), proporcional ao tamanho do padrão, Uma 
extensão simples deste esquema suporta procuras por prefixos. No entanto, ocorrências arbitrá- 
rias do padrão no texto (por exemplo, o padrão é um sufixo próprio de uma palavra ou abrange 
duas palavras) não podem ser eficientemente realizadas. 

Para construir um trie-padráo para um conjunto 5 de cadeias de caracteres, pode-se usar um 
algoritmo incremental que insere as cadeias uma de cada vez. Lembre-se da condição de que 
nenhuma cadeia de $ é um prefixo de outra cadeia de 5. Para inserir uma cadeia X no trie corrente 
T, primeiro tenta-se traçar o caminho associado com X em T, Como X ainda não está em T, e não 
€ prefixo de nenhuma outra cadeia, se para de traçar o caminho em um nodo interne v de T antes 
de chegar ao final de X. Então, eramos um novo caminho de nodos descendentes de v para anma- 
zenar os caracteres restantes de X. O tempo para inserir X é (drm), onde m é o0 comprimento de 
X, € dé o tamanho do alfabeto. Assim, construir um trie completo para o conjunto 5 custa tempo 
Dida). onde n é o comprimento total das cadeias de caracteres em 5. 

Existe uma potencial ineficiência de espaço no trie-padrão, que provocou o desenvolvimento 
do trie comprimido, que é também conhecido (por razões históricas) como trie Patricia. Neste 
caso, existem potencialmente muitos nodos no trie-padráo que têm apenas um filho, e a existén- 
cia desses nodos é um desperdício. Em seguida, será discutido o trie comprimido. 


12.3.2 Tries comprimidos 


Um irie comprimido € similar a um trie-padräo, mas garante que cada nodo interno no trie tenha 
pelo menos dois filhos, Ele garante esta regra comprimindo cadeias de nodos com apenas um 
filho em nodos isolados. (Ver Figura 12.8.) Seja T um trie-padräo. Diz-se que um nodo v de Fé 
redundante se v tiver um filho e não for a raiz. Por exemplo, o trie da Figura 12.6 tem & nodos 
redundantes. Agora será mostrado que uma cadeia de k = 2 nodos, 


(и IA A Pd, 
é redundante se: 


* y, for redundante parai=1,....k= 1, 
e ve», não forem redundantes. 
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24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 


47 48 49 50 51 52 5d 54 55 56 57 58 50 60 61 62 63 64 65 66 67 GB 


бз 70 71 72 73 M 75 TG 77 TB 79 B) 81 82 B3 B4 a 86 B7 Ва 


(b 


Figura 12.7 Procura de palavras e procura de prefixos com um trie-padráo: (a) texto a ser 
pesquisado; (b) trie-padráo para as palavras no texto (artigos e preposições, que também são co- 
nhecidos como stop words, excluídos), com nodos externos aumentados para indicar as posições 
das palavras, 


Pode-se transformar T em um trie comprimido substituindo cada cadeia redundante 
(vy Y MV el, je vu) com К = 2 arestas em uma única aresta (v. v,), renomeando v, com 
a concatenação dos rótulos dos nodos v... vi. 


Figura 12.8 Trie comprimido para as strings (hear, Bell, bid, Bull, buy, sell, stock, stop]. 
Compare-o com o trie-padrão mostrado na Figura 12.6. 
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12.3.4 Mecanismos de busca 


A World Wide Web contém uma imensa coleção de documentos textuais (páginas). A informa- 
ção sobre essas páginas é coletada por programas chamados de Web crawlers, que armazenam 
esta informação em bancos de dados especiais de dicionários. Um mecanismo de busca na Web 
permite que os usuários recuperen informações relevantes destes bancos de dados, identificando 
páginas relevantes па Web que contém determinadas palavras-chave. Nesta seção, será apresen- 
tado um modelo simplificado de um mecanismo de busca. 


Arquivos invertidos 


A informagäo-base armazenada por um mecanismo de busca é um dicionário, chamado de índice 
invertido ou arquivo invertido, o qual armazena pares chave-valor QuE). onde w é uma palavra е 
Lé uma coleção de páginas contendo a palavra w, Às chaves (palavras) no dicionário são chama- 
das de termos de índice, e devem ser um conjunto de itens de vocabulário e nomes próprios tão 
grande quanto possível. Os elementos neste dicionário são chamados de Fistas de ocorrências. e 
devem cobrir tantas páginas da Web quanto possivel. 

Pode-se implementar eficientemente um índice invertido com uma estrutura de dados con- 
sistindo de: 


1. um arranjo armazenando as listas de ocorrências dos termos (sem ordenação); 
2. um trie comprimido para o conjunto de termos de índice, no qual cada nodo externo 
armazene o índice da lista de ocorrência do termo associado. 


A razão para armazenar as listas de ocorrências fora do trie € manter seu tamanho pequeno 
o bastante para caber па memória interna. Em troca, por causa de seu grande tamanho total, as 
listas de ocorrências são armazenadas em disco. 

Com esta estrutura de dados, uma consulta por uma única palavra-chave é similar a uma 
procura por uma palavra em um texto (ver Seção 12.3.1). Ou seja, se encontra a palavra-chave по 
trie e se retorna a lista de ocorrências associada. 

Quando múltiplas palavras-chave são dadas, € à saída desejada é composta pelas páginas 
contendo todas as palavras, recupera-se a lista de ocorrência de cada palavra-chave usando o trie 
e retorna-se sua interseção. Para facilitar o cálculo da interseção, cada lista de ocorrências pode- 
ria ser implementada como uma sequência ordenada por endereço ou com um dicionário (ver, 
por exemplo, a junção discutida na Seção 11.6). 

Além da tarefa básica de retornar a lista de páginas contendo as palavras-chave dadas, os 
mecanismos de busca fornecem um importante serviço adicional classificando por relevância as 
páginas retornadas. Projetar algoritmos de classificação rápidos e precisos para mecanismos de 
busca é um desafio para pesquisadores em computação e para empresas de comércio eletrônico. 


12.4 Compressão de textos 


Nesta seção, analisa-se outra aplicação do processamento de textos, a compressão de textos. 
Neste problema, tem-se uma cadeia de caracteres X definida sobre um dado alfabeto como ASCO 
ou Unicode, е deseja-se codificar X eficientemente em uma pequena cadeia binária F (usando 
apenas os caracteres De 14, À compressão de textos é útil em qualquer situação em que a comu- 
nicação é feita através de um canal de baixa capacidade de transmissão, tais como um modem 
ou conexão infravermelha, e deseja-se minimizar o tempo necessário para transmitir o texto, 
De forma similar, a compressão de texto é útil para armazenar coleções de documentos mais 
eficientemente, permitindo que um meio de armazenamento de capacidade fixa comporte tantos 
documentos quanto possível, 


Hidden page 


Processamento de Texto 497 


12.4.4 О algoritmo de codificação de Huffman 


O algoritmo de codificação de Huffman começa com cada um dos d caracteres diferentes da ca- 
deia X a codificar como raízes de árvores binárias de um único nodo. C algoritmo prossegue em 
uma série de rodadas: em cada rodada, o algoritmo unifica as duas árvores binárias com menor 
frequência em uma única árvore binária, Esta operação é repetida até que apenas uma árvore 
exista, (Ver Trecho de código 12.8.) 

Cada iteração do laço enquanto no algoritmo de Huffman pode ser implementada em tem- 
ро N log d) usando-se uma fila de prioridades O, representada com um heap. Além disso, cada 
iteração retira dois elementos de O e adiciona um, em um processo que se repete d — | vezes 
antes de que exatamente um nodo esteja em Q. Assim, este algoritmo é executado em tempo 
On + d log d). Embora uma justificativa completa da correção desse algoritmo esteja além do 
escopo deste livro, mostra-se que ele é intuitivo por meio de uma idéia simples: qualquer co- 
dificação última pode ser convertida em uma codificação ótima em que os códigos para os dois 
caracteres de menor freqüencia, a e b, difiram apenas em seu último bit. Repetir o argumento 
para uma cadeia com a é 6 substituídos por um caractere c fornece a proposição a seguir: 


Proposição 12.10 O algoritmo de Huffman constrói uma codificação por prefixos ótima para 
uma cadeia de caracteres de comprimento n com d caracteres distintos em tempo On + d log d). 


Algoritmo Huffrnani X): 
Entrada: а cadeia de caracteres X de comprimento n com d caracteres distintos 
aida: uma árvore com a codificação de X 
Calcule a freqléncia fic) de todo caractere c em X. 
Inicialize uma fila de prioridade ©. 
para cada caractere c em À faça 
Crie uma árvore binária T de um único nodo armazenando c, 
Insira T em Q com chave flo). 
enquanto (L.size() > 1 faça 
fe Q.min( }.Кеу( ) 
T, < Q.removeMin( ) 
f, < Q.min( )key() 
Г.  Q.removeMin( } 
Crie uma nova árvore binária T com subárvore esquerda T, e subárvore T, direita, 
Insira T em Q com chave f, + f.. 
retorna Q.removeMin( ) 


Trecho de código 12.8 Algoritmo de codificação de Huffman. 


12.4.2 O método guloso 


O algoritmo de Huffman para construção de uma codificação ótima é um exemplo de aplicação 
de um padrão de projeto chamado de método guloso. Este padrão de projeto é aplicado em 
problemas de otimização em que se tenta construir alguma estrutura enquanto se minimiza ou 
maximiza alguma propriedade da estrutura. 

A forma geral para o método guloso é quase tão simples quanto para o método da força 
bruta. Para resolver um dado problema de otimização usando o método guloso, € feita uma se- 
quência de escolhas. A seqliéncia inicia com alguma condição inicial bem conhecida e calcula o 
custo para esta condição inicial. O padrão então exige que iterativamente sejam feitas escolhas 
adicionais identificando a decisão que atinge o melhor custo dentre todas as escolhas que são 
possíveis no momento. Esta abordagem nem sempre leva à solução ótima. 
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Existem vários problemas para os quais esta abordagem funciona, è tais problemas são co- 
nhecidos por terem a propriedade da escolha gulosa. Esta € a propriedade de que uma solução 
global бота pode ser atingida através de uma següëncia de soluções locais Ótimas (ou seja, es- 
colhas que são as melhores dentre as disponíveis a cada momento), começando de uma condição 
inicial bem definida, O problema de calcular uma codificação de prefixos ótima de comprimento 
variável é apenas um exemplo de um problema que possui a propriedade da escolha gulosa. 


12.5 Testando a similaridade de textos 


Um problema comum em processamento de texto, que surge em genética e em engenharia de 
software, é testar a similaridade entre duas cadeias de caracteres. Em uma aplicação em genética, 
as duas cadeias de caracteres poderiam corresponder a duas sequências de DNA, que poderiam, 
por exemplo, vir de dois indivíduos considerados geneticamente relacionados se eles tiverem 
uma longa subsequéncia comum em suas sequências de DNA. Em uma aplicação de engenharia 
de software, as duas cadeias de caracteres poderiam vir de duas versões do mesmo programa, e 
se pode desejar determinar quais mudanças foram feitas de uma versão para a outra. De fato, de- 
terminar a similaridade entre duas caderas de caracteres é considerada uma operação tão comum 
que os sistemas operacionais Unix e Linux são fornecidos com um programa, chamado diff, 
para comparar arquivos de texto. 


12.5.1 O problema da maior subseqüéncia comum 


Existem várias formas diferentes de definir a similaridade entre duas cadeias de caracteres. Mesmo 
assim, pode-se abstrair uma versão simples, mas comum, deste problema usando cadeias de carac- 
teres e suas subsegiiéncias. Dada uma cadeia X = x,x,x;---x,. uma subseqüencia de X é qualquer 
cadeia da forma x, x, onde i, 1.1. OU Seja, uma sequência de caracteres que não são necessa- 
riamente contiguos, mas são, mesmo assim, retirados de X em ordem. Por exemplo, a cadeia AAAG 
é uma subsegliência da cadeia CGATAATTGAGA. Observa-se que o conceito de subsegiiéncia de 
uma cadeia é diferente do conceito de uma substring de uma cadeia, definida na Seção 12.1. 


Definição do problema 


O problema específico de similaridade de textos abordado aqui é o problema da maior subseqü- 
éncia comum (LCS*). Neste problema, tem-se duas cadeias de caracteres, X = zr rx (EF = 
УУУ у definidas sobre algum alfabeto (como o alfabeto (A, C, G, T], comum em genética 
computacional) e deseja-se encontrar a cadeia mais longa 5 que é uma subseqiiéncia de X e Y. 

Uma maneira de resolver o problema da maior subsegiiéncia comum é enumerar todas as 
subseqüéncias de X е escolher a mais longa que for também uma subseguiéncia de Y, Já que cada 
caractere de X está ou não na subsegiiéncia, existem potencialmente 2" subseguências diferen- 
tes de X, cada uma das quais requer tempo Om) para determinar se é uma subseqüéncia de Y. 
Assim, esta abordagem de força bruta fornece um algoritmo exponencial executado em tempo 
O(2"m), que é muito ineficiente. Nesta seção, se discutirá como usar um padrão de projeto cha- 
mado programação dinâmica para resolver o problema da maior subseguência comum muito 
mais rápido. 


* N, de T. Em ingEs, longest common subsequente problem. 
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pode obter uma maior subsegliéncia comum adicionando х. ao final. Assim, uma maior 
subsequência comum de X[0..7] e F]O..f] termina com x, Portanto, faz-se 


Lig] = L- 1,j-1] + СЗЯ 


* 1,4 v Neste caso, nào se pode ter uma subseqiiéncia comum que inclui x, e у. Qu seja, 
pode-se ter uma subsegiiéncia comum terminando com x, ou uma que termine com y, 
(ou possivelmente nenhum dos dois), mas certamente não ambos. Portanto, faz-se 


L [i j] = max [L[i— 1. j] E [i Орех, + y. 


Para que ambas as equações façam sentido nos casos limite em que i = 0 ouj = 0, faz-se Eli, 
-1] = Ü para ¿=—1,0,1,....a— le £[—1,f] =0 para = —1,0.1,....m=-— Il. 

A definição acima para Le, j] satisfaz a otimização dos subproblemas, pois não é possivel ter 
uma maior subsequência comum sem também ter uma maior subseqiiéncia comum para os sub- 
problemas. Ela também usa a interseção de subproblemas, porque a solução de um subproblema 
Eli, j| pode ser usada em vários outros problemas (a saber, os problemas Lii + 1.7], Eli, j + lie 
Eli + dcl. 


й2їз4®б йш бїт 1012345675097 
V-CGATAATTGAGA Y-CGATAATTGAG русу 
майра: A BENNETT. 
А ГГССТААТА X=GTTCCTAATA 
brada raa 012723456755 


(a (hi 


Ea 


Figura 12,12 Os dois casos no algoritmo de maior subseqiiéncia comum: (a) x, = y; (b) x, + v, 
O algoritmo armazena apenas os valores de Li. J], não seus caracteres 


O algoritmo LCS 


Fazer desta definição de +. j] um algoritmo é realmente bastante simples. Inicializa-se um ar- 
ranjo L de dimensões (a + 1) X (m + 1) com os casos limite em que ў = О ou у = 0 Ou seja, 
inicializa-se L|i = 1] = U para i LOT, Lu # le £[—1l,/] = üparaj = —1,0,],....m — I. 
(Este é um ligeiro abuso de notação. pois, na realidade, se deveria indexar as linhas e colunas 
de L começando em 0.) Então, os valores de L são construidos iterativamente até que se obtém 
L[m = 1, m Ц. о comprimento da maior subseqüéncia comum entre X e Y. Fornece-se uma 
descrição em pseudocódigo de como esta abordagem resulta em uma solução com programação 
dinámica para o problema da maior subseguência comum (LCS) no Trecho de código 12.9. 
Algoritmo LCS(X, Y: 

Entrada: as caderas X e F com a e m elementos respectivamente, 

aida: рага і = hai — 1 ej = Ol... — |ocomprimento Д7. л] da cadeia mais bon- 


pa que é uma subseqiiéncia tanto de X[0..;] = хох, - + - x quanto de ИОД = у, - v. 
para i « | parar = | faça | 
Ці. = 1] «- 0 
para / — 0 para m — | faça 
L[—1,j] 0 


рага г «— Ü paras — | faça 
para j+ О paras = I faça 
sex, = y então 
Eli, 7] Lie 7.] +1 


Hidden page 


502 Estruturas de Dados e Algoritmos em Java 


12.6 Exercícios 


Para obter o código fonte e auxílio com os exercícios, visite java.datastructures.net 


Reforço 
R-12.1 


R-12,2 


R-12,3 
R-12,4 


R-12.5 


R-12.6 


R-12.7 


R-12.8 


R-12.9 


R-12,10 


R-12.11 


R-12.12 


R-12.13 


Quantos prefixos não-vazios da cadeia P —"aaabbaaa" são também sufi- 
xos de P? 


Desenhe uma figura ilustrando as comparações feitas pelo algoritmo de 
procura de padrões baseado em força bruta, para o caso em que à texto é 
"aaabaadaabaaa" e o padrão é "aabaaa”. 


Repita o problema anterior para o algoritmo BM de procura de padrões, não 
contando as comparações feitas para calcular à função last(c). 


Repita o problema anterior para o algoritmo KMP de procura de padrões, 
não contando as comparações feitas para calcular a função de falha. 
Calcule uma tabela representando a função last usada no algoritmo BM 
para o padrão 
"the quick brown fox jumped over a lazy cat" 
assumindo o seguinte alfabeto (que começa com um espaço em branco): 
E = [ abedefghijk Lina pars uva pl. 


Assumindo que os caracteres no alfabeto E podem ser enumerados e podem 
indexar arranjos, forneça um método de tempo Oun + [E] para construir a 
função last a partir de um padrão P de comprimento m. 


Calcule uma tabela representando a função de falha KMP para o padrão 
"cqtacgttcgtac", 
Desenhe um trie-padrão para a seguinte sequência de cadetas de caracteres: 


[ abab,baba,coccc,bbaaaa,caa,bbaacc,cbcc,cboca | Я 


Desenhe um trie comprimido рага o conjunto de cadeias de caracteres do 
Exercício R-12.8. 


Desenhe a representação compacta para o trie de sufixos para a cadeia 
"minimize minime", 


Qual o mais longo prefixo da cadeia "egtacgttegtacg" que também é 
um sufixo desta cadeia? 


Desenhe o arranjo das frequências e a árvore de Huffman para а seguinte 
cadeia, 


"dogs do not spot hot pots or cats". 
Mostre o arranjo L para a maior subseqüéncia comum para as duas cadeias 


X = "skullandbones" 
Y = "lullabybabies", 


Qual é uma maior subseqüéncia comum entre essas cadeias de caracteres? 


Criatividade 


C-12.1 


C-12.4 


C-12.6 


C-12.7 
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Dé um exemplo de um texto Г de comprimento л e um padrão P de compri- 
mento m que force o algoritmo de procura de padrões por força bruta à um 
tempo de execução EM mn). 

Justifique por que o método KMPFailureFunction (Trecho de código 11.5) 
precisa de tempo Om) em um padrão de comprimento m. 


Mostre como modificar o algoritmo de procura de padrões KMP de forma 
que ele ache todas as ocorrências de um padrão P que aparece como sub- 
string em T, ainda sendo executado em tempo (Mm + n). (Assegure-se de 
encontrar até as ocorrências que se sobrepõem.) 

Seja T um texto de comprimento a e P um padrão de comprimento m. Des- 
creva um método de tempo O(m + n) para encontrar o prefixo mais longo 
de P que é uma substring de T. 

Diz-se que um padrão P de comprimento m é uma substring circular de um 
texto T de comprimento n se existir um índice O = | € m tal que P = T [n — 
m in — |] T IO. — 1], ou seja, se Pé uma substring (normal) de Tou 
se P é igual à concatenação de um sufixo de Te um prefixo de T. Fomeça 
um algoritmo de tempo Mm + л) para determinar se P é uma substring 
circular de T. 

O algoritmo de procura de padrões KMP pode ser modificado para maior 
velocidade em cadeias de caracteres binárias redefinindo-se a função de 
talha como 


fU) = o maior k < j tal que P [Ok — 2] f, é sufixo de Р.Я, 


onde p, denota o complemento do k-ésimo bit de P. Descreva como imple- 
mentar o algoritmo KMP para tirar vantagem desta nova função de falha e 
forneça um método para avaliar esta nova função де falha. Mostre que este 
método faz no máximo n comparações entre o texto e o padrão (contra 2н 
comparações do algoritmo KMP padrão, dado na Seção 12.2.3). 
Modifique o algoritmo simplificado BM apresentado neste capítulo usan- 
do idéias do algoritmo KMP, de forma que ele seja executado em tempo 
O(m + m). 

Dada uma string X de tamanho n e uma string F de tamanho m, descreva 
um algoritmo que execute no tempo ín +m) para procurar o mais longo 
prefixo de X que é um sufixo de Y. 

Forneca um algoritmo eficiente para deletar uma cadeia de caracteres de 
um irie-padrão e analise seu tempo de execução, 

Forneca um algoritmo eficiente para deletar uma cadeia de caracteres de 
um trie comprimido e analise seu tempo de execução. 

Descreva um algoritmo para construir a representação compacta de um trie 
de sufixos e analise seu tempo de execução. 

Seja T uma cadeia de caracteres de comprimento s. Descreva um método 
de tempo Or) para encontrar o mais longo prefixo de T que seja uma sub- 
string do reverso de T. 
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C-12.13 


C-12.15 


C-12.16 


C-12.18 


C-12.19 


C-12.20 


C-1221 


Descreva um algoritmo eficiente para encontrar o mais longo palíndromo 
que seja um sufixo de uma cadeia de caracteres T de comprimento n. Lem- 
bre que um palíndromo é uma cadeia de caracteres que é igual a seu rever- 
so. Qual o tempo de execução de seu método? 

Dada uma sequência $ = (Xy лу. Mas co ..x, i) de números, descreva um 
algoritmo de tempo Om) para achar a mais longa subseqüéncia T = (x,, 
Xas Xi... X, (| de números, em que 4, < i, ex, > x,, Ou seja, Té a mais 
longa subseqüéncia descendente de 5. 

Defina a distância de edição entre duas cadeias de caracteres X e Y de 
comprimentos n e m, respectivamente, como sendo o menor número de 
alterações para transformar X em Y. Uma alteração consiste na inserção 
de caracteres, na deleção de caracteres ou na substituição de caracteres. 
Por exemplo, as cadeias de caracteres "algorithm" e "rhythm" têm dis- 
tância de edição 6, Projete um algoritmo de tempo (Ama) para calcular a 
distância de edição entre X e Y. 

Projete um algoritmo guloso para fazer troco para alguém que compra uma 
bala que custa x centavos e entrega ao balconista $1. Seu algoritmo deve 
minimizar o nümero de moedas do troco. 


a. Mostre que seu algoritmo guloso retorna o número mínimo de moedas 
se as moedas tiverem os valores de $0.25, $0.10, $0.05 e $0.01. 

b. Forneça um conjunto de moedas para o qual seu algoritmo pode não 
retornar o menor número de moedas. Inclua um exemplo em que seu 
algoritmo falha. 

Apresente um algoritmo eficiente para determinar se um padrão P é uma 

subseguência (nào substring) de um texto T. Qual é o tempo de execução do 

seu algoritmo? 

Seja x e y strings de tamanho n € m respectivamente. Defina Bir, j) para 

ser o tamanho do mais longo substring comum ao sufixo de tamanho i 

em e do sufixo de tamanho j em y. Projete um algoritmo que execute no 

tempo Oimn) para computar todos os valores de (Р) рага! = |,.. „ne 

J=]... 

Ana acaba de vencer um concurso que permite que ela pegue n balas de 

graça em uma loja. Ela tem idade suficiente para saber que algumas são 

caras, custando alguns dólares e outras são baratas e custam centavos, Os 
vidros de balas são numerados 0, 1,....m — 1 eo vidro j tem a, balas com 
um preço c, por bala. Forneça um algoritmo de tempo O(m + л} para que 

Ana maximize o valor das balas que irá retirar. Mostre que seu algoritmo 

produz o maior valor possível. 

Sejam três arranjos de números inteiros A, Be C, cada um de compri- 

mento n. Dado um inteiro arbitrário x, apresente um algoritmo de tempo 

On’ log n) que determina se existem números a € A, b c Вес € C tais 

quer-a-cb-c. 


Forneça um algoritmo de tempo On’) para o problema anterior. 
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Observações sobre o capítulo 


O algoritmo KMP é descrito por Knuth, Morris e Pratt em seu artigo [64], e Boyer e Moore des- 
crevem seu algoritmo em um artigo publicado no mesmo ano [15]. Em seu artigo, no entanto, 
Knuth er al. [64] também provam que o algoritmo BM tem tempo linear. Mais recentemente, 
Cole [23] mostra que à algoritmo BM realiza no máximo An comparações no pror caso e este 
limite é exato. Todos os algoritmos discutidos acima são discutidos também no livro de Aho [3], 
embora com uma ênfase para a teoria, incluindo os métodos para procura de expressões regula- 
res. O leitor interessado em outros estudos em procura de padrões em cadeias de caracteres pode 
usar os livros de Stephen [87] e os capítulos de Aho [3] e Crochemore e Lecrog [27]. 

O trie fol inventado por Morrison [73], e € discutido intensivamente no livro clássico Sorting 
and Searching de Knuth [63]. О nome "Patricia" abrevia "Practical Algorithm to Retrieve Infor- 
mation Coded in Alphanumeric” [78]. McCreight [70] mostra como construir tries de sufixos em 
tempo linear. Uma introdução ao campo da recuperação de informação que inclui uma discussão 
de mecanismos de busca para a Web é dada no livro de Baeza- Yates e Ribeiro-Neto [8]. 
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13,1 


O tipo abstrato de dados grafo 


Um grafo é uma forma de representar relacionamentos que existem entre pares de objetos. Isto é, 
um conjunto de objetos, chamados de vértices, juntamente com uma coleção de conexões entre 
pares de vértices, À propósito, esta noção de “grafo” não deve ser confundia com o diagrama de 
barras € funções plots, como estes tipos de “gratos” não são relacionados ao tópico deste capi- 
tulo. Grafos têm aplicações em vários domínios diferentes, incluindo mapeamento, transporte, 
engenharia elétrica e redes de computador. 

Visto de forma abstrata, um grafo G é simplesmente um conjunto V de vértices e uma co- 
leção E de pares de vértices de Y, chamados de arestas. Assim, um grafo é uma forma de repre- 
sentar conexões ou relações entre pares de objetos de algum conjunto V. Alguns livros usam uma 
terminologia diferente para grafos e referem-se ao que se chama de vértices, como nodos, e ao 
que se chama de arestas, como arcos. Serão utilizados aqui os termos “vértices” e “arestas”. 

As arestas em um grafo podem ser dirigidas ou ndo-dirigidas. Uma aresta (u,v) é dita dirigida 
de u para v se o par (u,v) for ordenado, com u precedendo v. Uma aresta (u,v) é dita ndo-dirigida 
se o par (u,v) não for ordenado. As arestas não-dirigidas são por vezes denotadas como conjuntos 
[4,4], mas, para simplificar, se utilizará a notação de pares ordenados (u,v), notando que no caso 
näo-dirigido (u,v) é o mesmo que (vu). Os grafos são visualizados tipicamente desenhando-se os 
vértices como ovais ou retângulos e as arestas como segmentos ou curvas conectando pares de ovais 
ou retângulos. A seguir, são apresentados alguns exemplos de grafos dirigidos e não-dirigidos. 


Exemplo 13.1 Pode-se visualizar colaborações entre pesquisadores de certa área construindo 
um grafo cujos vértices são associados com os pesquisadores e cujas arestas conectam pares de 
vértices associados com os pesquisadores que escreveram juntos um artigo ou livro. (Ver Figura 
13.1.) Tais arestas são ndo-dirigidas porque a co-autoria é uma relação simétrica, ou seja, se A 
é co-autor de B, então necessariamente B é co-autor de А. 


Smink 


" 
| Goodrich 
a 


Witter 


Preparala 


Figura 13.1 Grafo de co-autoria de alguns autores. 


Exemplo 13.2 Pode-se associar a um programa orientado a objetos um grafo cujos vértices 
representam as classes definidas no programa, e cujas arestas indicam a herança entre as clas- 
ses. Existe uma aresta de um vértice v a um vértice u se a classe para v estender a classe de u. 
Tais arestas são dirigidas porque a relação de herança só existe em uma direção (ou seja, ela é 
assimétrica). 


Se todas as arestas em um grafo forem não-dirigidas, então diz-se que o grafo é um grafo 
nüo-dirigido. De forma similar, um grafo dirigido, ou digrafo, é um grafo em que todas as ares- 
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tas são dirigidas, Um grafo que tem arestas dirigidas e não-dirigidas é chamado de grafo misto. 
Observe que um grafo náo-dirigido ou misto pode ser transformado em um grato dirigido substi- 
tuindo-se cada aresta náo-dirigida (u,v) por um par de arestas dirigidas (ev) e (vou). No entanto, 
é fregiientemente útil manter grafos não-dirigidos ou mistos em sua forma orginal, pois estes 
gratos têm várias aplicações, como a do próximo exemplo. 


Exemplo 13.3 Um mapa de cidade pode ser modelado como um grafo cujos vértices são cruzi- 
mentos ou finais de ruas, e cujas arestas podem ser trechos de ruas sem cruzamentos, Este grafo 
tem arestas ndo-dirigidas, representando rias de dois sentidos, e arestas dirigidas, correspon- 
dendo a trechos de um único sentido, Assim, um grafo representando as ruas de uma cidade é 
um grafo misto. 


Exemplo 13.4 Exemplos físicos de grafos estão presentes nas redes elétricas e de encanamento 
de um prédio, Tais redes podem ser modeladas como grafos, nos quais cada conector. junção ou 
stida são vistos como vértices, e cada trecho não-interrompido de fiação ou cano é visto como 
uma aresta. Tais grafos são, na verdade, componentes de grafos muito maiores, as redes locais de 
distribuição de energia е de dgua. Dependendo dos aspectos especifi os dos grafos em que esti- 
vermos interessudos, pode-se considerar suas arestas como dirigidas ou ndo-dirigidas, pois, em 


principio, a dena pode fuir em um cano nas duas direções, assim como a corrente em um fio. 


Os dois vértices conectados por uma aresta são chamados de vértices finais (ou pontos fi- 
nais) da aresta, Se uma aresta é dirigida, seu primeiro ponto final é sua origem, e o outro č seu 
destino. Dois vértices são ditos adjacentes se cles forem pontos finais da mesma aresta. Uma 
aresta é dita incidente а um vértice se o vértice for um dos pontos finais da aresta, As arestas 
incidentes de um vértice são as arestas dirigidas cuja origem é aquele vértice. As arestas inci- 
dentes em um vértice são as arestas dirigidas cujo destino é aquele vértice, O grau de um vértice 
v, denotado degí v). é o número de vértices incidentes a v. O grau de entrada е o grau de saida de 
um vértice v são os números de arestas incidentes em v e de v, respectivamente, e são denotados 
indeg(v) e outdegív). 


Exemplo 13.5 Pode-se estudar o transporte aéreo construindo um grafo G chamado de rede 
de vãos, cujos vértices são associados a aeroportos e cujas arestas são associadas com vãos. 
(ker Figura 13.2.) No grafo G, as arestas são dirigidas porque um dado vôo tem uma direção 
especifica (do aeroporto de origem ao aeroporto de destino). Os pontos finais de uma aresta 
e em CG correspondem respectivamente à origem e ao destino de vôo correspondente a e. Dois 
üeroportos são adjacentes em Cr se existir um vão entre eles, e uma dresta e será incidente a um 
vértice v de G se o vôo representado por e sair do aeroporto ou chegar ao aeroporto representa- 
do por v. As arestas incidentes de um vértice v correspondem aos vôos que saem do aeroporto de 
y, enquanto as arestas incidentes em v correspondem aos vôos que chegam, Finalmente, o grau 
de entrada de um vértice v de G corresponde ao número de vôos que chegam ao aeroporto de v, 
enguanto o grau de saida representa o número de vóos que aem. 


A definição de grafo refere-se ao grupo de arestas como uma coleção, não como um con- 
junto. permitindo que duas arestas näo-dirigidas tenham os mesmos pontos finais. e que duas 
arestas dirigidas tenham a mesma origem e mesmo destino. Tais arestas são chamadas de arestas 
paralelas ou arestas multiplas. As arestas paralelas podem estar em uma rede de vôo (Exemplo 
13.5) e, neste caso, múltiplas arestas entre o mesmo par de vértices indicam, vos diferentes оре- 
rando па mesma rota à diferentes horas do dia. Outro tipo especial de aresta é o que conecta um 
vértice consigo mesmo. Assim, diz-se que uma aresta (dirigida ou não-dingida) forma um lago 
se seus pontos finais coincidirem. Um laço pode ocorrer em um grafo associado com um mapa 
urbano (Exemplo 13,3), onde corresponderia a um “circulo” (uma rua circular que retorna a seu 
ponto de início). 
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Com poucas exceções, como as mencionadas acima, os grafos nào tém arestas paralelas ou 
lagos, e são ditos simples. Assim, pode-se geralmente dizer que as arestas de um grafo simples 
são um conjunto de pares de vértices (e não uma coleção). Neste capítulo, se assumirá que um 
grafo é simples a não ser que seja especificado de outra forma. 


Figura 13.2 Exemplo de um grafo dirigido representando uma rede de vôos. Os pontos finais 
da aresta UA 120 são LAX e ORD, portanto, LAX e ORD são adjacentes. O grau de entrada de 
DFW é 3, e o grau de saída de DFW é 2, 


Nas proposições a seguir, exploram-se algumas propriedades importantes dos grafos. 
Proposição 13.8 Se G for um grafo com m arestas, então 
y deg(v) = Im. 


vet; 


Justificativa Lima aresta (u.v) é contada duas vezes na soma acima: uma por seu ponto final и, 
e outra por seu ponto final v. Assim, a contribuição total das arestas para os graus dos vértices é 
de duas vezes o número de arestas. " 


Proposição 13.7 Se G for um grafo dirigido com m arestas, então 


Y indeg(v) = y outdeg(v) = m. 


re Cr rel 


Justificativa Em um grafo dirigido, uma aresta (u,v) contribui com uma unidade рага o grau 
de saida de sua origem u, € uma unidade para o grau de entrada de seu destino v. Assim, a contri- 
buicáo total das arestas para os graus de saída dos vértices é igual ao número de arestas e similar- 
mente para os graus de entrada. [| 


A seguir, será mostrado que um simples grafo com n vértices tem On”) arestas. 


Proposição 13.8 Seja G um grafo simples com n vértices e m arestas. Se G for ndo-dirigido, 
então m = nin — IV, e se G for dirigido, então m = nn — 1) 

Justificativa Suponha que O seja näo-dirigido. Como duas arestas não podem ter os mesmos 
pontos de saída e de chegada, e não há laços, o grau máximo de um vértice em Gén — 1 neste 
caso. Assim, pela Proposição 13.6, tem-se 2m = піп — 1). Agora, suponha que G seja dirigido. 
Como duas arestas não podem ter 04 mesmos pontos de saída e de chegada, é não há laços, o 
grau máximo de entrada de um vértice em G én — | neste caso. Assim, pela Proposição 13.7, 


m nin — 1}. m" 
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Um caminho em um grafo é uma seqüéncia alternada de vértices e arestas que se inicia em 
um vértice e termina em um vértice, de tal forma que cada aresta seja incidente de seu anteces- 
sor e incidente em seu sucessor. Um cielo é um caminho em que os vértices de início e fim são 
os mesmos, Diz-se que um caminho é simples se cada vértice no caminho for distinto, e diz-se 
que um ciclo é simples se cada vértice no ciclo for distinto, exceto pelo primeiro e o último. Um 
caminho dirigido € um caminho em que todas as arestas são dirigidas e percorridas em sua di- 
reção. Um ciclo dirigido é definido de forma similar, Por exemplo, a rede de vôos da Figura 13,2 
(BOS, NW35, JFK, AA 1387, DFW) é um caminho dirigido simples e (LAX, UA 120, ORD, 
UAR, DEW, AA 49, LAA) é um ciclo dirigido simples. Se um caminho P ou ciclo C é um 
simples grafo, pode-se omitir as arestas em P ou C, como estas são bem definidas; neste caso, P 
é uma lista de vértices adjacentes e C é um ciclo de vértices adjacentes. 


Exemplo 13.9 Dado um grafo G representando o mapa de uma cidade (ver Exemplo 13.3), 
pode-se modelar um casal dirigindo de casa até um restaurante como um caminho em Cs, Se eles 
souberem o caminho e não passarem acidentalmente pelo mesmo cruzamento duas vezes, entdo 
eles passam por um caminho simples em C. Pode-se modelar o caminho completo do casal, de 
casa ao restaurante e de volta, como um ciclo. Se eles voltam para casa por uma rota completa- 
mente diferente da usada para chegar ar restaurante, Sem nem passar ex ит mesmo crulamen- 
to, entdo toda a viagem de ida e volta ё um ciclo simples. Finalmente, se eles só passarem por 
ruas de mão única, entdo pode-se modelar sua saida como um ciclo dirigido. 


Um subgrafo de um grafo G é um grafo Н cujos vértices € arestas são respectivamente sub- 
conjuntos dos vértices e arestas de C. Por exemplo, na rede de vôos da Figura 13.2, os vértices 
BOS, JFK e MÍA e as arestas AA 903 e DL 247 formam um subgrafo. Um subgrafo de cober- 
tura de G é um subgrafo de G que contém todos os vértices de G. Um grafo é conexo se, para 
¿qualsquer dois vértices, existir um caminho entre eles, Se um grafo G não for conexo, seus stih- 
gratos conexos maximais são chamados de componentes conexos de С. Uma floresta é um grato 
sem ciclos, Uma drvore é uma floresta conexa, ou seja, um grafo conexo sem ciclos. Observe que 
esta definição de uma árvore é um pouco diferente da definição fornecida no Capítulo 7. Ou seja, 
no contexto dos grafos, uma árvore não tem raiz. Sempre que houver ambigzüidade, as árvores do 
Capítulo Y serão chamadas de drvores com raiz, enquanto as árvores deste capítulo serão chama- 
das de drvores livres. Os componentes conexos de uma floresta são árvores (livres). Uma drvore 
de cobertura de um grafo é um subgrafo de cobertura que é uma árvore (livre). 


Exemplo 13.10  Talvez o grafo mais popular atualmente seja a Internet, que pode ser vista 
como um grafo cujos vértices são computadores e cajas arestas (ndo-dirigidas) são conexões de 
comunicação entre pares de computadores na Internet. Os computadores e ax conexões em um 
único domínio como wiley, com formam um subgrafo da Internet. Se este subgrafo for conexo, 
então dois usuários em computadores deste domínio podem mandar mensagens um do outro sem 
que os pacotes de informação deixem o domínio. Supondo que as arestas deste subgrafo formem 
uma árvore de cobertura. 1550 implica que se uma única conexdo for desfeita (por exemplo, por- 
que alguém desliga um dos cabos de rede ou encosta-se a ele e ele sai do lugar) entdo o subgrafo 
nào хеп mais conexa. 


Existe uma série de propriedades simples de árvores, florestas e grafos conexos. Serão ex- 
ploradas algumas delas na proposição a seguir. 


Proposição 13.11 Seja G um grafo náo-dirigido com n vértices e m arestas. Entúo tem-se 


e Se Gr for conexo, endo m = n = 1. 
“Sed for uma drvore, entdo m = п — 1. 
e Se G for uma floresta, entdom En — |. 


A justificativa desta proposição é deixada como um exercício (C- 1 3.2). 
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em um contéiner Y, que pode ser tipicamente um arranjo ou lista de nodos. Representando-se V 
como um arranjo, por exemplo, então pensa-se naturalmente nos vértices como sendo numerados. 
Objetos vértices 

O objeto vértice para um vértice v armazenando o elemento o tem variáveis instanciadas para 


* uma referência para e. 
* uma referência para a posição (ou localizador) do objeto vértice na coleção V. 


A principal característica da lista de arestas não é a maneira como ela representa os vértices, 
mas como ela representa as arestas, Nesta estrutura, uma aresta e de C, armazenando um elemen- 
too, é explicitamente representado por um objeto aresta. Os objetos arestas são armazenados em 
uma coleção E, que seria tipicamente um arranjo ou lista de nodos. 


Objetos arestas 


O objeto aresta para uma aresta e armazenando o objeto o tem vartáveis instanciadas para 
* uma referência para о; 
* relerências para os objetos vértice em V associados com os pontos finais de e; 
* uma referência para а posição (ou localizador) do objeto aresta na coleção E. 


Visualização da lista de arestas 


Um exemplo de uma lista de arestas para um grafo Cr é ilustrado na Figura 13.3. 


alelsla) (еер 


i 1 
' ` 


i) 


Figura 13.3 (a) Um grafo 6; (b) representação esquemática da lista de arestas para бт. Visuali- 
zam-se os elementos armazenados nos objetos vértice e aresta com os nomes dos elementos, em 
ver de referências reais aos objetos dos elementos. 
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A razão pela qual esta estrutura é chamada de lista de arestas é porque a implementação 
mais simples e comum da coleção E é uma lista. Mesmo assim, para poder procurar convenien- 
temente por objetos específicos associados a uma aresta, pode-se desejar implementar E com um 
dicionário, apesar de continuar chamando a estrutura de “lista de arestas”. Também pode-se de- 
sejar implementar o contéiner V como um dicionário pela mesma razão, Ainda assim, mantendo 
a tradição, chama-se a estrutura de “lista de arestas”. 

A característica principal da lista de arestas € que ela provê acesso direto das arestas aos 
vértices nos quais elas são incidentes, [850 permite definir algoritmos simples para os métodos 
endVertices(e le opposite v.e). 


Desempenho da lista de arestas 


Um método ineficiente para a lista de arestas € o que acessa as arestas incidentes à um vértice. 
Determinar este conjunto de vértices requer uma inspeção exaustiva de todos os objetos arestas 
da coleção E. Isto é, para determinar quais arestas são incidentes a um vértice v, deve-se exami- 
nar todas as arestas na lista de arestas e verificar se cada uma é incidente a v. Assim, o método 
incidentEdgesiv) executa no tempo proporcional ao número de arestas do grafo, e não no tempo 
proporcional ao grau do vértice v. Na realidade, até para verificar se os dois vértices v e w são ad- 
jacentes usando o método areAdjacent(v,w), requer uma pesquisa em todas as arestas da coleção 
procurando por uma aresta com vértices finais v e w. Além disso, assim como remoção de um 
vértice envolve a remoção de todas as suas arestas incidentes, o método removeVertex também 
requer uma pesquisa completa de todas as arestas da coleção E. 

A Tabela 13.1 resume o desempenho da implementação de um grafo por lista de arestas sob 
a hipótese de que as coleções Ve É estejam implementadas com listas duplamente encadeadas 
(Seção 6.4.2). 


Tabela 13.1 Tempos de execução dos métodos para grafos implementados através de uma lista 
de arestas, onde Ve E são implementados com listas encadeadas. O espaço usado é On + m), 
onde л é o número de vértices e m é o número de arestas. 


Os detalhes dos métodos selecionados para o TAD grafo são os seguintes: 


* Os métodos vertices() e edges() são implementados chamando V.iterator() e E.iterator ), 
respectivamente. 

+ Os métodos incidentEdges e areAdjacent custam tempo Om), pois para determinar quais 
arestas são incidentes a um vértice v deve-se inspecionar todas as arestas. 

+ Já que as coleções Ve E são listas implementadas com uma lista duplamente encadeada, 
pode-se inserir vértices, e inserir e remover arestas em tempo (1). 

* O método removeVertex(v) custa tempo Om), pois requer que todas as arestas sejam ins- 
pecionadas para encontrar e remover aquelas incidentes a v. 


Desta formå, a representação de lista de arestas é simples, porém tem limitações significantes, 
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e arestas em ambas as direções permite acelerar o desempenho de uma série de métodos para 
grafos usando-se uma lista de adjacéncia no lugar de uma lista de arestas, A Tabela 13.2 resume 
o desempenho da implementação do grafo com lista de adjacências, assumindo que as coleções 
Ve E e as coleções de vértices incidentes são todas implementadas com listas duplamente en- 
cadeadas. Para um vértice v, o espaço usado pela coleção de incidentes de v é proporcional do 
grau de v, isto é, ele é Oideg(v)), Assim, pela Proposição 13.6, o espaço requerido da lista de 
adjacéncia é On + m). 


| Operação 

vertices Er 

edges m 

endVertices, opposite : 

incidentEdges v) | O(deg (vy) 
| areAdjacent( к.м) Бару | O(min(deg(v), deg (w)) 
| replace i CMI) 

insertVertex, insertEdge, removeEdge, OT 

removeVertex deg vi 


Tabela 13.2 Tempos de execução dos métodos de um grafo implementado com uma lista de ad- 
jacências. O espaço usado é (Xn + m), onde n é o número de vértices e mé o número de arestas, 


Em contraste com a forma da lista de arestas fazer as coisas, à lista de adjacéncia provê tem- 

pos de execução melhorados para os seguintes métodos: 

. Os métodos incidentEdgesiv) custam o tempo proporcional ao número de vértices inci- 
dentes de v, isto €, tempo de O(degtv)). 

* (s métodos areAdjacent(u,v) podem ser executados pela inspeção ou pela coleção de 
incidentes de n ou de v. Pela escola do menor dos dois, tem-se o tempo de execução de 
O(mintdegiu), deg v). 

«+ O método removeVertex(v) custa o tempo de O(deg(v)). 


13.2.3 A matriz de adjacéncia 


Como à lista de adjacências, a representação de um grafo por matriz de adjacéncia estende a 
estrutura de armazenamento das arestas com um componente adicional. Neste caso, aumenta-se a 
lista de arestas com uma matriz Cum arranjo de duas dimensões) A, que permite que se determine 
adjacências entre pares de vértices em tempo constante. Na matriz de adjacência, consideramos 
os vértices como sendo os inteiros no conjunto (0, 1l,... 2 — 17,6 as arestas como sendo pares 
desses inteiros. [sso permite armazenar referencias para as arestas nas células de um arranjo de 
duas dimensões A n X n. Especificamente, a representação por matriz de adjacência estende a 
lista de arestas da maneira a seguir (ver Figura 13.51 


e Um objeto vértice v também armazena uma chave inteira única entre Ое л = 1, chamada 
de indice de v. 

+ Mantem-se um arranjo de duas dimensões А т X т tal que a célula Ali, j] contenha uma 
referência para o objeto aresta (vw), se ela existir, onde v é o vértice com indice ie w éo 
vértice com índice j. Se não houver aresta, então Ali, Д = nulo. 
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Figura 13.5 (a) um grafo G sem arestas paralelas; (b) representação esquemática da matriz de 
adjacéncia simplificada de Cr. 


Desempenho da matriz de adjacência 


Para grafos com arestas paralelas, a representação da matriz de adjacências deve ser estendida 
de forma que, em vez de ter Ali, Д armazenando um ponteiro para uma aresta associada (vw), 
ela deve armazenar um ponteiro para uma coleção de incidentes Mv,w), que armazena todas as 
arestas de v a w. Por que a maioria dos grafos considerados são simples, esta complicação não 
será considerada aqui. 

A (simples) matriz de adjacéncia A permite executar o método areAdjacent(v,w) no tempo 
O(1). Alcanga-se este tempo de execução pelo acesso aos vértices v e w para determinar seus 
respectivos indices ¿e р, e então testar se Ali, у] é nulo ou não. O ótimo desempenho do método 
areAdjacent é cancelado por um incremento do espaço usado, o qual é agora Hin), e do tempo 
de execução de outros métodos. Por exemplo, o método incidentEdges(v) agora requer que se 
examine toda uma linha ou coluna do arranjo А, e. assim, executar no tempo On). Além disso, 
qualquer inserção ou remoção de vértice agora requer a criação de tado um novo arranjo A, de 
maior ou menor tamanho, respectivamente, o que leva à tempo de Сп). 

A Tabela 13.3 resume o desempenho da implementação de um grafo com matriz de ad- 
jacéncia. A partir desta tabela, observa-se que a lista de adjacéncia é superior a matriz de 
adjacéncia no espaço e é superior no tempo para todos os métodos, exceto para o método 
areAdjasent, 
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edges 
endVertices, opposite, areAdjacent 
incidentEdgesí vi 

replace, insertEdge, removeEdge, 
insertVertex, removevertex Б 


0 (am ) 


Tabela 13.3 Tempos de execução para um grafo implementado com matriz de adjacéncia. 


Historicamente, a matriz de adjacéncia booleana foi a primeira representação usada para 
grafos (de forma que Ali, j| = verdadeiro se e somente se (i. j) for uma aresta). Não se deve 
considerar este fato surpreendente, no entanto, pois a matriz de adjacência tem um apelo natural 
como estrutura matemática (por exemplo, um grafo näo-dirigido tem uma matriz de adjacéncia 
simétrica), A lista de adjacências veio depois, com seu apelo natural para cálculos devido a seus 
métodos mais rápidos para a maioria dos algoritmos (muitos algoritmos não usam o método are- 
Adjacent | e sua eficiência em termos de espaço. 

A maior parte dos algoritmos de grafos examinados neste livro serão eficientes quando es- 
tiverem agindo sobre um grafo armazenado usando uma lista de adjacências. Em alguns casos, 
no entanto, a situação pode se balancear, pois grafos com poucas arestas são processados mais 
eficientemente com uma lista de adjacéncia, enquanto grafos com muitas arestas são processados 
mais eficientemente com uma matriz de adjacência. 


13.3 Caminhamento em grafos 


A mitologia grega fala de um elaborado labirinto construido para abrigar o monstruoso Mino- 
tauro, parte homem e parte touro. Este labirinto era tão complexo que nenhum animal ou homem 
podia escapar dele. Até que o herói grego Teseu, com a ajuda da filha do rei, Ariadne, decidiu 
implementar um algoritmo de caminhamento em grafos. Teseu amarrou um novelo de linha na 
porta do labirinto e o desenrolou à medida que caminhava pelas tortuosas passagens à procura 
do monstro. Evidentemente, ele sabia sobre o bom projeto de algoritmos, pois após encontrar e 
vencer o Minotauro ele facilmente seguiu o fio de volta à porta e dos braços de Ariadne. Formal- 
mente, um cominhamento é um procedimento sistemático para a exploração de um grafo pelo 
exame de todos os seus vértices e arestas. 


13.3.1 Pesquisa em profundidade 


O primeiro algoritmo de caminhamento analisado é o caminhamento em profundidade (DES, em 
inglés, depth-first search) em um grafo nào-dirigido. O caminhamento em profundidade é útil 
em uma variedade de tarefas com grafos, incluindo encontrar um caminho de um vértice a outro, 
determinar se um grafo é conexo ou não e achar uma árvore de cobertura de um grafo conexo, 
O caminhamento em profundidade em um grato nào-dirigido G é análogo a caminhar em um 
labirinto com um fio e uma lata de tinta, sem se perder. Começa-se em um vértice especifico s em 
G, o qual se inicializa amarrando nosso fio ase pintando s para marcá-Io como "visitado". O vér- 
tice s é agora o vértice "atual"— se chamará o vértice atual de а daqui para frente. Percorre-se С 
considerando uma aresta arbitrária (s.v) incidente ao vértice atual m. Se a aresta (u,v) levar a um 
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vértice v já visitado (ou seja, pintado), retorna-se imediatamente ao vértice u. Se, por outro lado, 
(uv) levar a um vértice v não-visitado, então desenrola-se um pouco de nosso fio e vai-se para v. 
Pinta-se v como “visitado” e faz-se com que ele passe a ser o vértice atual, repetindo a operação. 
Mais cedo ou mais tarde, se irá à um local sem saída, ou seja, o vértice atual w tal que todas às 
arestas incidentes a и levem a vértices já visitados. Para sair desse impasse, enrola-se um pouco 
do nosso fio, retornando pela aresta que nos levou an até um vértice já visitado v, Faz-se de v 
nosso vértice atual e repete-se a operação acima para quaisquer arestas incidentes a v que não se 
tenha explorado antes. Se todas as arestas incidentes a v conduzirem a vértices já visitados, então 
enrola-se mais um pouco do fio e retorna-se ao vértice anterior a v no caminho que se percorreu 
e repete-se a operação naquele vértice. Assim, continua-se a retornar ao longo do caminho que já 
se percorreu até achar um vértice que ainda tenha uma aresta não-cxplorada, então se seguirá esta 
aresta e se continuará o caminhamento. O processo termina quando nosso retorno nos trouxer de 
volta ao vértice inicial s, e não houver mais arestas inexploradas incidentes a s. 
Esse processo simples percorre as arestas de Cs. (Ver Figura 13.6.) 


Arestas de descoberta e arestas de retorno 


É possível visualizar um caminhamento em profundidade ao orientar as arestas pela direção em 
que são exploradas durante o caminhamento, distinguindo as arestas usadas para descobrir novos 
vértices, chamadas de arestas de descoberta ou aresta de ärvore, daquelas que levam a vértices 
já visitados, chamadas arestas de retorno. (Ver Figura 13.6f.} Na analogia acima, as arestas de 
descoberta são as arestas em que se desenrola o ho quando são percorridas, e as arestas de retor- 
no são as arestas em que se retorna imediatamente sem desenrolar o fo. Como será visto, as args- 
tas de descoberta formam uma árvore de cobertura do componente conexo do vértice de início 
х. Chamam-se as arestas que não estão nesta árvore de “arestas de retorno”, porque assumindo 
que a árvore tem o vértice inicial como raiz, então cada uma dessas arestas leva de um vértice na 
árvore a um de seus ancestrais. 

O pseudocódigo do caminhamento em profundidade iniciando em um vértice v segue a ana- 
logia do fio e da tinta. Usa-se a recursáo para implementar a analogia do fio e pressupõe-se ter 
um mecanismo (a analogia da tinta) para determinar se um vértice ou aresta já foi explorado e 
para rotular as arestas como sendo de descoberta ou de retorno. Esse mecanismo val exigir espaço 
adicional e pode afetar o tempo de execução do algoritmo. Uma descrição em pseudocódigo do 
algoritmo recursivo do caminhamento em profundidade € mostrada no Trecho de código 13.1. 


Algoritmo DFSG, v 
Entrada: um grafo Cr e um vértice v de G. 
Saída: as arestas de O rotuladas como “descoberta” ou “retomo”. 
rotule v como “descoberta” 
para todos vértices e em G.incidentEdgestv) faga 
se a aresta e for inexplorada então 
we tr.opposite(v.r) 
se vértice w for inexplorado então 
rotule e como sendo de “descoberta” 
chame DFS( Cru) 
sendo 
rotule e como sendo de “retorno” 


Trecho de código 13.1 O algoritmo de caminhamento em profundidade. 
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Figura 13.6 Exemplo de um caminhamento em profundidade em um grafo, iniciando no vérti- 
ce A, Arestas de “descoberta” são mostradas em linhas sólidas e arestas de retorno são mostradas 
em linhas pontilhadas: (a) grafo de entrada; (bj caminho de arestas de descoberta a partir de A 
até que o retorno (B.A) é atingido, (c) alcança-se F, que é um local sem saída; (d) após retornar 
a C, continua-se pela aresta (CG) е chega-se a outro local sem saída; (e) após retornar а С; (f) 
após retornar а N. 
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alement( Retorna o elemento armazenado nesta posição. 


putka Mapeia o valor de decoração x para a chave k, retornando o valor antigo 
de £, ou null, se este for um novo valor para É. 
getik): Busca o valor de decoração x assinalado para k, ou null, se não existir 
mapeamento para k. 


removelk} Remove o mapeamento da decoração para É, retornando o valor antigo, 
ou null, se nào existir. 


entres() Retorna todos os pares chave-decoração para esta posição, 


Os métodos do mapa de uma posição decorável p provê um mecanismo simples para acessar 
e definir as decorações de p. Por exemplo, usa-se p.gat(k) para obter o valor da decoração com 
chave k, e usa-se p.put(k.x) para definir o valor da decoração com chave É para x. Além disso, a 
chave А pode ser qualquer objeto, incluindo um objeto especial explored que o nosso algoritmo 
de caminhamento em profundidade pode criar. Mostra-se uma interface Java definindo um TAD 
deste tipo no Trecho de código 13.2. 

Pode-se implementar uma posição decorável com um objeto que armazena um elemento e 
um mapa. Em princípio, os tempos de execução dos métodos de uma posição decorável depen- 
dem da implementação baseada em mapa, Entretanto, a maioria dos algoritmos utiliza um pe- 
queno número constante de decorações. Assim, os métodos da posição decorável executarão no 
tempo Oil) no pior caso, independentemente de como se implementa o mapa embutido, 


public interface DecorablePosition<E> 
extends Position<E=, Map< Object Object> | 

| // Sem a necessidade de novos métodos - Esta é uma mistura da interface Position e da 
interface Map. 


Trecho de código 12.2 Uma interface definindo um TAD para posições decoráveis. Não se 
usam tipos genéricos parametrizados para a herança dos métodos da interface Map, visto que não 
se sabem antecipadamente os tipos das decorações, e precisa-se permitir decorações de objetos 
de diferentes tipos. 


Usando posições decoráveis, o algoritmo completo de caminhamento em profundidade pode 
ser descrito em maiores detalhes, como mostrado no Trecho de código 13.3. 


Algoritmo DFSG dy 

Entrada: Um grafo G com vértices e arestas decoráveis, um vértice x de G e uma chave de 
decoração Ё. 

Saida: Uma decoração dos vértices do componente conexo de v com a chave ke valor Vi- 
SITADO e das arestas do componente conexo de v com chave k e valores DESCOBERTO e 
RETORNO, de acordo com o caminhamento em profundidade de G. 

v putik, VISITADO) 
para todas areste e de GincidemEdgesiv) faça 
se e getik) = nulo então 
we opposite) 
se w.get(k) = nulo então 
e put(K, DESCOBERTO) 
DFS(G, wk) 

senão 
e putik RETORNO) 


Trecho de código 13.3 Caminhamento em profundidade em um grafo com arestas e vértices 
decoráveis. 
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Implementação em Java de um caminhamento em profundidade genérico 


Nos Trechos de código 13.4 e 13.5, mostra-se uma implementação em Java de um caminhamento 
em profundidade genérico através da classe geral, DFS, que tem um método, execute, que pega um 
grafo de entrada, um vértice inicial e qualquer informação auxiliar necessária, e então inicializa o 
grafo e as chamadas recursivas ao método recursivo dfsTraversal, que ativa o caminhamento DFS. 
Essa implementação assume que os vértices e arestas são posições decoráveis, e eles usam decora- 
ções para falar se os vértices e arestas tem sido visitados ou não, A classe DFS contém os seguintes 
métodos para permitir que ele faça tarefas especiais durante um caminhamento em profundidade. 


setup(): chamado antes de fazer a invocação ao dfsTraversaN ) 

initResult( ): chamado no início da execução de dfsTraversal. 

startVisit(v): chamado no inicio da visita em v. 

traverseDiscovery(e, v): chamado quando uma aresta de descoberta e saindo de v é per- 

corrida. 

= traverseBack(e, v): chamado quando uma aresta de retorno e saindo de v é percorrida. 

+ isDone( |: chamado para determinar se é necessário terminar o caminhamento antecipa- 
damente, 

e finishVisit(v): chamado quando todas as arestas incidentes а v foram percorridas. 

* resul): chamado para retomar o resultado de dfsTraversal. 

+ finalResult(r): chamado para retornar a saída do método, dada a saída, r, de disTraversal. 


/** Caminhamento genérico em profundidade de um grafo usando o patrão template. 
* Uma subclasse deverá sobrecarregar vários métodos para adicionar funcionalidade. 
A subclass should override various methods to add functionality. 

* Tipos parametrizados: 
* Y otipo para os elementos armazenados como vérticas 
+ E, o tipo para os elementos armazenados como arestas 
+ | 0 tipo para o objeto informação passada para o método executar 
+ R.otipo para o objeto retornado pelo DFS 
+ 

public class DFS-V, E, |, П> [ 
protected Graph-V, E> graph; YO grafo sendo caminhada 
protected Vertex V- start; ¿Po vértice inicial para o DFS 
protected | info; // o objeto informação passado ao DFS 
protected A visitResult; “o resultado de uma chamada recursiva 
protected static Object STATUS = new Object(); “fo atributo status 
protected static Object VISITED = new Object): ¿valor VISITADO 
protected static Object UNVISITED = new Object); // valor NÃO VISITADO 
/** Marca uma posiçao [vértice ou aresta) como visitado, */ 
protected void visit{DecorablePosition<?> p) ( p.put(STATUS, VISITED); | 
/** Marca uma posição (vértice ou aresta) como não visitado. */ 
protected void unVisitiDecorablePosition=7?= p) { p.putíSTATUS, UNVISITEDI; } 
/** Testa se uma posição (vértice ou aresta) está visitada. */ 
protected boolean isVisited(DecorablePosition- ?-- p) | 

return (p.get(STATUS) == VISITED); 


/** Método setup que é chamado antes da execução do DFS. */ 

protected void setup() [|] 

/** Resultado inicializado (primeira chamada, uma vez por vértice visitado). */ 
protected void initResult[ ) { } 

/** Chamado quando se encontra um vértice (v). */ 

protected void startVisit(Vertex --V-» v) { } 

/** Chamado após finalizar a visita a um vértice (v). */ 
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protected void finisnVisit(Vertex - V- v) f} 

F** Chamada quando se cruza uma aresta descoberta (e) a partir de um vértice (from). */ 
protected void traverseDiscovery(Edge--E-- e, Мепбех = from) | } 

Fe Chamada quando se cruza uma aresta de retorno (e) a partir de um vértice (from). */ 
protected void traverseBacklEdge<E> e, Vertex V- from) (| 

/** Determina se o cruzamento foi feito antes. */ 

protected boolean isDionei | | return false; /* valor padrão */] 

/** Retorna um resultado de uma visita (se necessário). */ 

protected Н resulti ) return null; /* valor padrão */ ] 

/** Retorna o resultado final da execução do método DFS. */ 

protected A finalResultR г} { return г; /* valor padrão */] 


Trecho de código 13.4 Variáveis de instâncias e métodos suportados pela classe DFS, que executa 
um caminhamento em profundidade, Os métodos visit, unVisit e isVisited estão implementados usan- 
do posições decoráveis que são parametrizadas usando o caractere coringa, “2”, que pode adaptar 
ou ao parâmetro V ou E usados para posições decoráveis. (Continua no Trecho de código 13.5) 


/** Executa um caminhamento em profundidade no grafo q, iniciando 
* a partir de um vértice de inicio s, passando em um objeto informação (in) */ 
public Н execute(Graph-- V, E> q, Vertex=V> s, lin) { 


graph = g; 
start = =: 
info = in; 


for(Vertex —V-— v; graph.vertices |) unVisit(v): // marca os vértices como não-visitados 
forlEdge<E> e: graph.edges || unVisit(e); // marca as arestas como náo-visitadas 
setup |: i executa qualquer configuração antes da caminhamento DFS 

return finalResultidtsTreversal(start)); 


/** metodo recursivo para um caminhamento DFS genérico. */ 
protected A disTraversal(Vertex-- > v) I 
теці |; 
if (lisDanel || 
startVisit(vi: 
if ('isDone( Y) [ 
visiti); 
for (Edges E> e: graph.incidentEdgesiv)) { 
if ('isVisited(en { 
if encontrou uma aresta inexplorada, explora-a 
міз еј; 
Vertex<V> w = graph.opposite(v, е); 
if Пачуе ен) { 
Aa está inexplorada, isto ё uma aresta descoberta 
traverseDiscoveryle, vi 
if (isDonei |) break; 


visit Result = dts Traversaliw); !! pega o resultado do filho a árvore DFS 
if (isDone( у) break; 

} 

else i 


;/ w está explorada, isto é uma aresta de retorno 
traverseBackle, vi; 
if isDone( |) break; 
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iitisDone( | 
finishVisit(u}; 
return resulti |; 


} 
| // fim da classe DFS 


Trecho de código 13.8 O método principal template dfsTraversal da classe DFS, que executa um 
caminhamento em profundidade genérico de um grafo. (Continuação do Trecho de código 13.4.) 


Usando o padrão de templates para O caminhamento 


Esse caminhamento em profundidade genérico é baseado no método de templates (ver Seção 
7.3.7), que descreve um mecanismo genérico que pode ser especializado redefinindo-se certos 
passos. O mecanismo usado para identificar os vértices e arestas que já foram visitados durante o 
caminhamento é encapsulado nas chamadas para os métodos isVisited, visit e unVisit, Para fazer 
algo interessante, deve-se estender a classe DFS e redefinir alguns dos métodos auxiliares, Esta 
abordagem segue o padrão de métodos de templates. Us Trechos de Código 13,6-13.9 ilustram 
algumas aplicações do dis Traversal. 

A classe ConnectivityTesterDFS (Trecho de código 13.6) testa se um grafo é conexo. Ela 
conta o número de vértices alcançáveis através de um caminhamento em profundidade iniciando 
em um vértice, e compara este número com o número total de vértices do grafo. 


/** Esta classe especializa DFS para determiner se o grafo é conexo, */ 
public class ConnectivityDFS-- V, E> extends DFS <W, E, Object. Boolean > { 

protected int reached; 

protected void setup) [ reached = 0; | 

protected void startVisit(Vertex « V- v) [ reached-- +; } 

protected Boolean finalResult(Baolean dfsResult) { 

return new Booleanireached graph.nurn vertices 1 

} 

} 


Trecho de código 13.6 Especialização da classe DFS para testar se o grafo é conexo, 


Á classe ComponentsDFS (Trecho de código 13.7) procura os componentes conexos de um 
grafo. Ele rotula cada vértice com o número do componente conexo, usando o padrão decorator, 
e retorna o número do componente conexo encontrado, 


/** Esta classe estende DFS para realizar as components conexos de um grafo. *f 
public class ComponentsOFS<V E> extends DFS<Y E, Object, Integer> { 
protected Integer compNumber; ¿número do componente conexo 
protected Object COMPONENT = new Object]; // Salacionador do componente conexo 
protected void setup! ) | compNumber = 1; } 
protected void апл егех у v) ( v.put( COMPONENT, complhNumber);) 
protected Integer finalPFesultilnteger disFesult) i 
for (Vertex -V- v : graph.vertices( |) H verifica por qualquer vértice não visitado 
if iget STATUS) == UNVISITED) { 
compNumber += 1; //tem-se encontrado outro componente conexo 
dísTraversal(v); // visita todos os vertices deste componente 
| 
return campMurrnber; 
À 
1 


Trecho de código 13.7 Especialização da classe DFS para computar os componentes Conexos, 
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A classe FindPathDFS (Trecho de código 13.8) encontra um caminho entre um par de vér- 
tices dados. Ela realiza um caminhamento em profundidade a partir do vértice inicial. Mantém- 
se o caminho formado pelas arestas de descoberta a partir do vértice inicial até o vértice atual. 
Quando se encontra um vértice inexplorado, ele é adicionado ao final do caminho, e quando se 
termina de processar o vértice, ele é removido do caminho, O caminhamento é finalizado quan- 
do o vértice final é encontrado e o caminho é retornado como um iterador de vértices e arestas 
(ambos tipos de posições em um grafo), Observa-se que o caminho encontrado por esta classe se 
constitui de arestas de descoberta. 


/** Classe que especializa DFS para encontrar um caminho entre um vértice de inicio e um 
* determinado vértice. Ela assume que o determinado vértice é passado como o objeto info 
+ para a método execute. Ela retorna uma lista de vértices e arestas compreendendo о 
* caminho do início até info. O caminho retornado estã vazio se info estiver inalcançável a 
* partir do inicio. */ 

public class FindPathDFS-V. E> 

extends DFS<MV E, Vertex - W=, lterable= Position >> [ 
protected PositionList< Position= path; 
protected boolean done; 
/** Método setup para inicializar o caminho. */ 
public void setupí ) [ 
path = new NodePositionList<Position>]); 
done = false; 
| 
protected void startVisitiVertex <v> v) [ 
path. addLastivj ¿adiciona o vértice v ao caminho 


if (v == info) 
done = true; 
| 
protected void finisnvisit(Vertex-- V- v) ( 
path.removelpath.lasti 3); // remove v do caminho 
if(?path.isEmptyt |) se v nào for o vértice inicio 
path.remowvef(path.lasti |): ¿remove a aresta descoberta em v a partir do caminho 
} 


protected void traverseDiscovery(Edge--E- e, Vertex4> from) | 
path.addlast(e; adiciona a aresta e ao caminho 


] 
protected boolean isDone( | | 


return done; 
} 
public Iterable-- Positian-- finalResultilterable<Position> г) { 
return path; 
} 
} 


Trecho de código 13.8 Especialização da classe DFS para procurar o caminho entre os vértices 
inicial e final, 


A classe FindCycleDFS (Trecho de código 13.9) encontra um ciclo no componente co- 
nexo de um dado vértice +, realizando um caminhamento em profundidade a partir de v, que 
termina quando uma aresta de retorno é encontrada. Ela retorna um iterador (possivelmente 
vazio), do ciclo formado pelos vértices e aresta em um ciclo formado pela aresta de retorno 
encontrada. 
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dos” os vértices adjacentes ao vértice inicial s — estes vértices são colocados по nível 1. Na segunda 
etapa, desenrola-se o fio no comprimento de duas arestas e visitam-se todos os novos vértices que 
é possível alcançar sem desenrolar mais fio. Esses novos vértices, que são adjacentes aos vértices 
do nivel | e nào foram associados anteriormente a um nível, são colocados no nivel 2, ё assim por 
diante. O caminhamento em largura termina quando todos os vértices tiverem sido visitados. 

O pseudocódigo para um caminhamento em largura iniciando em um vértice s é mostrado no 
Trecho de código 13.10. Usa-se espaço auxiliar para rotular arestas, marcar vértices visitados e 
guardar contémeres associados com os níveis. Ou seja, as coleções Lo Lp La ete. armazenam os 
vértices que estão no nível O, nível 1, nível 2, e assim por diante. Esses contêineres poderiam, por 
exemplo, ser implementados como filas. Eles também permitem que o caminhamento em largura 
não seja recursivo. 


Algoritmo BFSi x): 
Inicializa a coleção L, para conter o vértice s 
iel 
enquanto £ não estiver vazia faça 
Cria coleção £,, inicialmente vazia 
para todos os vértices v em L faça 
para todas as arestas e em G.incidentEdgesiv) faça 
se aresta e estiver inexplorada então 
wo (opposite v.c) 
se vértice w estiver inexplorado então 
rotula e como uma aresta descoberta 
insere w em L 
senão 
rotula ғ como uma aresta cruzada 
ei + 1 
Trecho de código 13.10 O algoritmo de caminhamento em largura. 


Nustra-se um caminhamento em largura na Figura 13.7. 

Uma das boas propriedades do caminhamento em largura é que, durante o caminhamento, 
pode-se rotular cada vértice com o comprimento do menor caminho (em termos de número de 
arestas) desde o vértice inicial s. Em particular, se o vértice v é colocado no nível é pelo caminha- 
mento iniciado em s, então o comprimento do menor caminho de s a véi. 

Assim como o caminhamento em profundidade, pode-se visualizar o caminhamento em lar- 
gura orientando as arestas de acordo com a direção em que são exploradas durante o caminha- 
mento, e distinguindo as arestas usadas para descobrir novos vértices, as chamadas arestas de 
descoberta, e aquelas que levam a vértices já visitados, as arestas de cruzamento. (Ver Figura 
13.76.) Assim como o caminhamento em profundidade, as arestas de descoberta formam uma 
árvore de cobertura, que neste caso chama-se de árvore BES. No entanto, não se chamam, neste 
caso, as arestas fora da árvore de “arestas de retorno”, pois nenhum deles conecta um vértice a 
um de seus antecedentes. Cada aresta fora da árvore conecta um vértice v a outro vértice que não 
é ner angestral nem descendente de v, 

O algoritmo de caminhamento em largura tem várias propriedades interessantes, algumas 
das quais são exploradas na proposição que segue. 

Proposição 13.14 Seja G um grafo ndo-dirigido no qual um caminhamento em largura inicia- 


do em um vértice s fol realizado. Então 


e ocaminhamento visita todos os vértices no componente conexo des; 
“as arestas de descoberta formam uma drvore de cobertura T chamado de árvore de co- 
bertura BES, para o componente conexo de 5; 
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Figura 13.7 Exemplo de caminhamento em largura, onde as arestas incidentes a um vértice são 
exploradas na ordem alfabética dos vértices adjacentes. As arestas de descoberta são mostradas 
com linhas sólidas, e as arestas de cruzamento são mostradas com linhas pontilhadas: (a) o grafo 
antes do caminhamento; (b) descoberta do nível 1; (c) descoberta do nível 2; (d) descoberta do 
nivel 3; (e) descoberta do nível 4; (f) descoberta do nível 5. 
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O fechamento transitivo de um digrafo Géo digrafo G*, em que os vértices de G* são os 
mesmos de G, e G^ tem um vértice (u,v) sempre que G tiver um caminho dirigido de и para v. Ou 
seja, define-se G* começando com o dígrafo G e adicionando uma aresta extra (u,v) para cada u e 
v tal que v, seja atingível a partir de и (e não existir ainda uma aresta (u,v) em 6). 


Figura 13.3 Exemplos de atingibilidade em um digrafo: (a) um caminho dirigido de BOS a LAX 
é desenhado em cinza; (b) um ciclo dirigido (ORD, MIA, DFW, LAX, ORD) é mostrado em cinza; 
seus vértices formam um subgrafo fortemente conexo: (c) os vértices e arestas atingíveis de ORD 
são mostrados em cinza; (d) remover as arestas pontilhadas em cinza produz um digrafo acíclico. 


Problemas interessantes que lidam com a atingibilidade em um digrafo G incluem os seguintes: 

* Dados vértices u € v, determinar se u atinge v. 

e Achar todos os vértices de G que sejam atingiveis desde um dado vértice s. 

* Determinar se G é fortemente conexo. 

* Determinar se G é aciclico. " E 

* Determinar o fechamento transitivo G^ de G. 

No restante desta seção, serão explorados alguns algoritmos eficientes para resolver esses 
problemas. 


13.4.1 Caminhamento em um digrafo 


Assim como grafos não-dirigidos, pode-se explorar um dígrafo de forma sistemática com mé- 
todos semelhantes ao caminhamento em largura (BFS) e ao caminhamento em profundidade 
(DES) definidos previamente para grafos não-dirigidos (Seções 13.3.1 e 13.3.3). Essas explora- 
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ções podem ser usadas, por exemplo, para resolver questões de atingibilidade. Os métodos di- 
rigidos para caminhamento em profundidade e caminhamento em largura que se desenvolverão 
nesta seção para essas tarefas são muito semelhantes aos seus correspondentes não-dirigidos. 
De fato, a única diferença real é que estes métodos dirigidos para caminhamento em profundi- 
dade e caminhamento em largura somente percorrem as arestas de acordo com suas direções 
respectivas. 

A versão dirigida do caminhamento em profundidade (DES) iniciando no vértice v pode ser 
descrito pelo algoritmo recursivo no Trecho de código 13,11 (Ver Figura 13.9.) 


Algoritmo DirectedDFS (v): 
Marque o vértice v como visitado. 
para cada aresta (1,9) saindo de v Taça 
se vértice w nào for visitado então 
Chame recursivamente Directed DFE iw). 


Trecho de código 13.11 О algoritmo DirectedDFS. 


MES 


pi E] 


(a) (b) 


Figura 13.9 Um exemplo de caminhamento em profundidade em um digrafo: (a) passo inter- 
mediário, em que pela primeira vez um vértice já visitado (DFW) é alcançado, (b) o caminha- 
mento em profundidade completo. As arestas da árvore são mostradas com linhas sólidas cinzas 
as arestas de retorno são mostradas com linhas pontilhadas cinzas; e as arestas de descoberta e de 
cruzamento são mostradas com linhas pontilhadas pretas. À ordem na qual os vértices são visita- 
dos é indicada pelo número próximo ao vértice. À aresta (ORD, DFW) é uma aresta de retorno, 
mas (DEW, ORD) é uma aresta de descoberta. A aresta (BOS, SFO) é uma aresta de descoberta 
e (SFO, LAX) é uma aresta de cruzamento. 


Um caminhamento em profundidade em um digrafo G particiona as arestas de G atingíveis 
pelo vértice inicial em arestas de árvore ou arestas de descoberta, que levam a descobrir um 
novo vértice, e em arestas fora da árvore, que levam a um vértice visitado previamente. As 
arestas de árvore formam uma árvore com ralz no vértice inicial, chamada de árvore de profun- 
didade, e existem três tipos de arestas fora da árvore: 

+ arestas de retorno, que conectam um vértice a seu antecessor na árvore de profundidade; 

+ arestas de descoberta, que conectam um vértice a um descendente na йгусге de profun- 

didade: 

+ arestas de cruzamento, que conectam um vértice a um vértice que não é nem seu anteces- 

sor nem seu descendente. 


Ver Figura 13.9h para um exemplo de cada tipo de aresta fora da árvore. 
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Proposição 13.16 Seja G um digrafo. О caminhamento em profundidade em G iniciando em 
um vértice s visita todos os vértices de G que são atingiveis desde s, A drvore de profundidade 
contém caminhos dirigidos de s a qualquer vértice atingível a partir de s. 


Justificativa Seja V, o subconjunto de vértices de G visitados pelo caminhamento em profun- 
didade iniciando em um vértice s. Deseja-se mostrar que V, contém s e qualquer vértice atingível 
a partir de s. Supõe-se, para obter uma contradição, que há um vértice w atingivel desde s que 
não está em V, Considere-se um caminho dirigido de s a w е seja (u,v) a primeira aresta deste 
caminho que nos retira de Y, ou seja, u está em V, e v não está, Quando o caminhamento em 
profundidade atinge u, ele explora todas as arestas saindo de и e, por isso, deve atingir também 
o vértice v via a aresta (u,v). Portanto v deve estar em V, e obtém-se uma contradição, Assim, V, 
deve conter cada vértice atingivel a partir de 5. E 


Analisar o tempo de execução do caminhamento em profundidade dirigido é um processo 
análogo ao seu equivalente não-dirigido. Em particular, uma chamada recursiva é feita para cada 
vértice uma vez e cada aresta é percorrida uma vez (desde sua origem). Assim, se п, vértices e m, 
arestas podem ser atingidos a partir de um vértice s, um caminhamento em profundidade dirigido 
iniciando em s é executado em tempo On, + i), desde que o digrafo seja representado com uma 
estrutura de dados que suporte os métodos para vértices e arestas em tempo constante. A estrutu- 
ra de dados lista de adjacência, por exemplo, satisfaz esta exigência. 

Pela Proposição 13.16, usa-se o caminhamento em profundidade para encontrar todos ов 
vértices atingiveis a partir de um dado vértice, e, portanto achar o fechamento transitivo de б 
. Ou seja, faz-se um caminhamento em profundidade iniciando de cada vértice v em G para ve- 
rificar quais vértices w são atingiveis a partir de v, adicionando uma aresta (v,w) ao fechamento 
transitivo para cada um desses vértices w. De forma similar, percorrendo repetidamente o dígrafo 
G com o caminhamento em profundidade, iniciando cada vez em um vértice diferente, testa-se 
facilmente se С é fortemente conexo. Ou seja, С será fortemente conexo se cada caminhamento 
em profundidade visitar todos os vértices de G. 

Assim, obtém-se imediatamente a proposição a seguir. 


Proposição 12.17 Seja G um digrafo com n vértices e m arestas. Os problemas a seguir serão 
solucionados por um algoritmo que percorra G n vezes usando cominhamento em profundidade, 
executado em tempo rin + m)) e que usa memória O(n): 


* determinar, para cada vértice v de O o subgrafo atingivel a partir de v; 
è lestar se O É fortemente conexo; 
ә determinar o fechamento transitivo G* de С. 


Testando conexões fortes 


Pode-se determinar se um grafo dirigido G é fortemente conexo muito mais depressa do que a 
proposição acima determina, usando apenas dois caminhamentos em profundidade, Começa-se 
realizando um caminhamento em G iniciando em um vértice arbitrário s. Se existe algum vértice 
de G que não é visitado por este caminhamento e não é atingivel a partir de s, então o grafo não é 
fortemente conexo. Assim, se este primeiro caminhamento visita cada vértice de G, então rever- 
tem-se todas as arestas de G (usando o método reverseDirection) e realiza-se outro caminhamento 
em profundidade iniciando em s neste grafo “revertido”. Se cada vértice de G é visitado por este 
segundo caminhamento, então o grafo é fortemente conexo, pois cada um dos vértices visitados 
no caminhamento pode atingir s. Já que este algoritmo realiza apenas dois caminhamentos em 
profundidade sobre G, ele é executado em tempo (Mn + m). 
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Figura 13.10 Sequência de dígrafos determinados pelo algoritmo Floyd- Warshall: (a) digrafo 
inicial G = б, e enumeração dos vértices; (b) dígrafo б, (с) С. (d) Gs (e) Gu (f Cr. Vide que 
G,=6, =6, Se o digrafo G, , tem as arestas (у. у) e (v. v). màs não a aresta (у, v.), no desenho 
do digrafo G,, são mostradas as arestas (у, Ve in, vj com linhas tracejadas cinzas, e a aresta 
(v, v.) com linha continua cinza. 
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Figura 13,11 Duas ordenações topológicas do grafo cíclico dirigido. 


Proposição 13.21 G tem uma ordenação topológica se e somente se G for aciclica. 
Justificativa A necessidade (o “somente se" da proposição? é fácil de demonstrar. Suponha que 
Ge topologicamente ordenado. Assume-se, para obter uma contradição, que G tem um ciclo con- 
sistindo nas arestas (v, , vue [Viga Fighe ces uv. Por causa da ordenação topológica, deve-se 
eri EL С. O gue é cacumen impossível. Assim, Cr deve ser acíclico. 

Agora, jestifiek- se a suficiência da condição (o "se" da proposição). Suponha que G seja 
aciclico. Será fornecida uma descrição algoritmica de como construir uma ordenação topológica 
para G, Como O é acíclico, G deve ter um vértice ao qual não chega nenhuma aresta (ou seja, um 
vértice com grau de entrada 0). Seja v, um vértice assim. De fato, se v, não existir, então ao per- 
correr um caminho dirigido a partir de um vértice arbitrário se terminaria por encontrar um vér- 
tice visitado previamente, o que contradiz o fato de Cr ser acíclico. Removendo-se v, de G, bem 
como suas arestas de saída, o dígrafo resultante ainda é aciclico. Portanto, o dígrafo resultante 
também tem um vértice v, ao qual não chegam arestas. Repetindo esse processo até que o dígrafo 
G esteja vazio, obtém-se uma ordenação v, . . ..v, dos vértices de G. Pela construção acima, se 
(v,,v,) é uma aresta de G, então v, deve ser nado antes que v, possa ser removido e, portanto, 
i «jg. Assim, ту... „и uma ordenação topológica. = 


A justificativa da Proposição 13.21 sugere um algoritmo (Trecho de código 13.13) chamado 
de ordenação topológica, para determinar uma ordenação topológica de um dígrafo. 


Algoritmo TopologicalSort (С): 
Entrada: um dígrafo С com n vértices. А 
Saida: шпа ordenação topológica v, . . .,v, de G 
Seja 5 uma pilha inicialmente vazia. 
para todos u encontrados em O vertices() faça 
Seja incounter(u) o grau de entrada de ш. 
se incounter(u) = О então 
S.push(u) 
= | 
enquanto 5 isEmpty( ) Faça 
м = S.pop() 
Seja u o vértice numerado como i na ordenação topológica. 
11 
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para cada aresta de saída (uw) de м faça 
incounter(w) «— incounter(w) — 1 
se incounter(w) = O então 


S.push(w) 


Trecho de código 13.13 — Pseudocódigo para o algoritmo de ordenação topológica. (Um exem- 
plo de aplicação deste algoritmo é mostrado na Figura 13,12.) 


Proposição 13.22 Seja G um digrafo com n vértices e m arestas. O algoritmo de ordenação 
topológica é executado em tempo O(n + m) usando espaço auxiliar An), e determina uma or- 
denação topológica de G ou ndo consegue numerar algum vértice, o que indica que G rem um 
ciclo dirigido. 

Justificativa A determinação inicial dos graus de entrada e preparo das variáveis incounter 
podem ser feitos com uma passagem sobre o grafo, que custa tempo Oin + m). Usa-se o pa- 
drão de decoradores para associar atributos contadores a cada vértice. Um vértice u é visitado 
pelo algoritmo de ordenação topológica quando и é removido da pilha 5. Um vértice u pode 
ser visitado somente quando incounter(u) = 0, o que implica que todos os seus predecessores 
(vértices com arestas que levam a w) foram visitados previamente. Como consegiiéncia, qual- 
quer vértice que faça parte de um ciclo dirigido nunca será visitado, e qualquer outro vértice 
será visitado exatamente uma vez. O algoritmo percorre todas as arestas saindo de cada vérti- 
ce visitado exatamente uma vez, portanto, seu tempo de execução é proporcional ao número 
de arestas saindo dos vértices visitados, Assim, o algoritmo é executado em tempo Ola + m). 
Quanto ao espaço usado, a pilha 5 е as variáveis incounter associadas aos vértices usam espa- 
ço Om). E 


Como um efeito secundário, o algoritmo de ordenação topológica do Trecho de código 
13.13 também testa se um grafo G é aciclico. De fato, se o algoritmo termina sem ordenar 
todos os vértices, então o subgrafo dos vértices que não foram ordenados deve conter um ciclo 
dirigido. 


13.5  Grafos ponderados 


Como foi visto na Seção 13.3.3, a estratégia de caminhamento em largura pode ser usada 
para encontrar um caminho mínimo de algum vértice inicial a cada um dos outros vértices em 
um grafo conexo. Esta abordagem faz sentido em casos em que cada aresta é tào boa quanto 
qualquer outra, mas existem muitas situações em que esta abordagem nào é apropriada, Por 
exemplo, pode-se estar usando um grafo para representar uma rede de computadores (como 
a Internet) e pode-se estar interessado em encontrar o caminho mais rápido para enviar um 
pacote de dados entre dois computadores. Neste caso, provavelmente não é correto conside- 
rar todas as arestas equivalentes, pois algumas conexões na rede são tipicamente muito mais 
rápidas do que outras (por exemplo, algumas arestas podem representar conexões lentas por 
linha telefônica, enquanto outras representam ligações de alta velocidade em fibra ótica). Da 
mesma forma, desejando-se usar um grafo para representar as estradas entre cidades, pode- 
se estar interessado em achar as distâncias mais curtas entre elas. Neste caso, provavelmente 
também não é correto considerar todas as arestas equivalentes, pois algumas distâncias serão 
muito maiores do que outras. Assim, é natural considerar grafos cujas arestas não sejam todas 
equivalentes. 

Um grafo ponderado é um grafo que tem um valor numérico w(e) (por exemplo, um inteiro) 
associado a cada aresta e, chamada de peso de e. Um exemplo de um grafo ponderado é mostrado 
na Figura 13,13. 
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ENC 
Ch} (1) 


Figura 13.12 Exemplo de uma execução do algoritmo TopologicalSort (Trecho de código 
12.11): (a) configuração inicial; {b-i} após cada iteração do lago enquanto. Os números nos vér- 
tices mostram o número do vértice e o valor corrente de incounter para o vértice. As arestas per- 
corridas são mostradas com setas cinzas tracejadas. Linhas espessas mostram o vértice e arestas 
examinadas na interação corrente. 
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Supondo que se tem um grafo ponderado C e se é solicitado a encontrar um caminho minimo 
de um vértice v a cada outro vértice em C, considerando os pesos das arestas como distâncias. 
Nesta seção, exploram-se formas eficientes de encontrar todos os caminhos mínimos, se existi- 
rem. O primeiro algoritmo que se discute É para о caso simples e comum em que todos os pesos 
das arestas em Cr são não-negativos (ou seja, wie) = O para toda aresta e de Cr}; portanto, sabe-se 
de antemão que não podem haver ciclos negativos em C. O caso especial de determinar um ca- 
minho mínimo quando todos os pesos são 1 foi resolvido com o algoritmo de caminhamento em 
largura, apresentado na Seção 13.3.3. 

Existe uma abordagem interessante para resolver este problema de origem única baseado 
no método guloso (Seção 12.4.2). Com este método o problema foi resolvido fazendo repe- 
tidamente a melhor escolha entre as disponíveis em cada iteração. Este paradigma pode ser 
frequentemente usado em situações em que se está tentando otimizar alguma função de custo 
em uma coleção de objetos. Pode-se adicionar objetos um de cada vez à essa coleção, sempre 
escolhendo o próximo que otimiza a função entre aqueles objetos ainda a serem escolhidos. 


136.1 O algoritmo de Dijkstra 


A idéia principal na aplicação do método guloso para o problema do caminho minimo com 
origem única é realizar um caminhamento em largura “ponderado” iniciando-se em v. Em 
particular, pode-se usar o método guloso para desenvolver um algoritmo que iterativamente 
aumenta uma “nuvem” de vértices em torno de +, com os vértices entrando na nuvem na se- 
quéncia de suas distâncias de y. Assim, a cada iteração o próximo vértice escolhido É o vértice 
fora da nuvem e que está mais próximo de v. O algoritmo termina quando não há mais vértices 
fora da nuvem e, neste momento, se terá o caminho mais curto de v para qualquer outro vérti- 
ce de €. Esta abordagem € um simples e poderoso exemplo do padrão de projeto baseado no 
método guloso, 


Um método guloso para determinar caminhos minimos 


Aplicar o método guloso para o problema do caminho mínimo com origem única resulta em 
um algoritmo conhecido como algoritmo de Dijkstra. Quando é aplicado a outros problemas de 
grafos, no entanto, o método guloso pode não achar necessariamente a melhor solução (como no 
Casa do problema do caixeiro riajante, no qual se deseja encontrar о menor caminho que visita 
todos os vértices do grafo exatamente uma vez). Mesmo assim, existem várias situações nas quais 
o método guloso permite determinar а melhor solução, Neste capítulo, duas dessas situações serão 
discutidas: determinando caminhos mínimos e construindo de uma árvore de cobertura minima, 

Para simplificar a descrição do algoritmo de Dijkstra, pressupóe-se que o grafo de entrada 
Cr seja ndo-dirigido (ou seja, todas as suas arestas são nao-dirigidas e simples (ou seja, ele não 
tem arestas paralelas nem vértices com arestas para si mesmos. Assim, denota-se as arestas de C 
como pares de vértices não-ordenados (nz), 

No algoritmo de Dijkstra, para determinar caminhos mínimos, a função de custo que se 
deseja otimizar em nossa aplicação do método guloso também é a função que se deseja avaliar 
— à distância do caminho minimo. 1550 pode parecer um raciocínio circular até se notar que é 
possivel implementar esta abordagem usando um truque para inicializá-la, que consiste em usar 
uma aproximação para a função de distância que se deseja calcular e que, ao final do processo, 
será exatamente igual à distância real. 
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Figura 13.14 Execução do algoritmo de Dijkstra em um grafo ponderado. O vértice inicial é 
RWI. Uma caixa próxima a cada vértice v armazena o rótulo D[v]. O símbolo « é usado no lugar 
de +00, As arestas da árvore do caminho mínimo são desenhadas como linhas espessas cinzas e 
para cada vértice u fora da “nuvem” mostram a melhor aresta atual para u com uma linha sólida 
cinza. (Continua na Figura 13,15.) 
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Figura 13.16.) Sabe-se pela escolha de z, que y já está em C neste momento. Além disso, D[y] = 
div.y) pois u é o primeiro vértice incorreto, Quando y foi colocado em C, testa-se (e possivelmen- 
te atualiza-se) D[z] de modo que se teve naquele momento 


Diz] = Diy] + willy, 2) = div, y) + willy, 2)). 
Mas já que z é o próximo vértice no caminho mínimo de v para u, isto implica que 
Diz] = div, 2). 
Mas se está agora escolhendo u e não z para ser colocado em C, por isso 
Du] = Diz]. 


Deve ficar claro que um subcaminho de um caminho mínimo é também um caminho míni- 
mo. Portanto, já que z está no caminho mínimo de v até u, 


div, z) + diz, м) = div. м). 
Além disso, diz) = 0 porque não há arestas com pesos negativos. Assim, 
Ои] = Diz] = dv, г) = dv, 2) + dz, u) = div, u). 
Mas isto contradiz a definição de u, portanto não pode existir tal vértice u. E 
O primeiro vértice “incorreto” 


С u escolhido a seguir 
^ portanto D[u] € Diz 
E po jul € D[z] 


4 


pr 
Du] > divu) 


Diy] = div.» 


y D[z] = Auz) 
Figura 13.16 Uma ilustração esquemática para a justificativa da Proposição 13.23. 


O tempo de execugáo do algoritmo de Dijkstra 


Nesta seção, analisa-se a complexidade do algoritmo de Dijkstra. Denota-se com n e m o número 
de vértices e arestas do grafo G, respectivamente, Assume-se que os pesos das arestas podem ser 
somados e comparados em tempo constante. Por causa do alto nível da descrição fornecida para 
o algoritmo de Dijkstra no Trecho de código 13.14, analisar seu tempo de execução requer que 
se tenha mais detalhes de sua implementação, Especificamente, deve-se indicar as estruturas de 
dados usadas e como elas são implementadas. 

Assume-se que se está representando o grafo G com uma lista de adjacência. Esta estrutura 
de dados permite percorrer os vértices adjacentes a u durante o passo de relaxamento em tempo 
proporcional a seu número. Isso ainda não decide todos os detalhes do algoritmo, pois se deve 
saber mais sobre como se implementa a outra estrutura de dados principal do algoritmo — a fila 
de prioridade Q. 

Uma implementação eficiente da fila de prioridade Q usa um heap (ver Seção 8.3). Isso per- 
mite extrair o vértice 4 com o menor rótulo D (o método será chamado de removeMin) em tempo 
log п). Como dito no pseudocódigo, cada vez que se atualiza o rótulo D[z] deve-se atualizar a 
chave de z na fila de prioridade. Se Q é implementada como um heap, então essa atualização da 
chave pode, por exemplo, ser feita retirando e em seguida reinserindo z com a nova prioridade. 


Grafos 547 


Se a fila de prioridade Q suporta o padrão de localizadores (ver Seção 8.4), então é possível im- 
plementar facilmente essas atualizações de chave em tempo (log n). pois um localizador para o 
vértice z permitiria que Q tivesse acesso direto ao item armazenando z no heap (ver Seção 8.4). 
Assumindo esta implementação de C o algoritmo de Dijkstra é executado em tempo cim + m) 
log m). 

Voltando ao Trecho de código 13.14, os detalhes da análise do tempo de execução são os 
seguintes: 


* A inserção de todos os vértices em ( com suas chaves iniciais pode ser feita em tempo 
Oin log n) através de inserções repetidas, ou tempo Of) usando а construção bottom-up 
(ver Seção 8.3.6). 

* A cada iteração do laço enquanto gasta-se tempo (log n) para remover o vértice н de Q 
e tempo ideg (v) log n) para realizar o relaxamento nas arestas incidentes a u. 

* O tempo total de execução do laço enquanto é 


kN |+ degree) log, 


que é (ín + m) log n) pela Proposição 13.6. 


Ao desejar expressar o tempo de execução como uma função de n apenas, então ela é Och 
log n) no pior caso. 


Uma implementação alternativa do algoritmo de Dijkstra 


Considere uma implementação alternativa para a fila de prioridade O usando uma sequência 
nào-ordenada. Isso, é claro, requer que se gaste tempo Cog) para retirar o menor elemento, mas 
permite atualizações de chave muito rápidas desde que Q suporte o padrão de localizadores (Se- 
ção 8.4.2). Especificamente, pode-se implementar cada atualização de chave feita em um passo 
de relaxamento em tempo OC — simplesmente altera-se o valor da chave depois de localizar o 
nem em O Portanto, essa implementação resulta em um tempo de execução que é Mi + m), 
que pode ser simplificado para On’) já que G é simples. 


Comparando as duas implementações 


Tem-se duas escolhas para implementar a fila de prioridade no algoritme de Dijkstra: uma im- 
plementação de heap baseada em localizadores, que tem tempo de execução Ola + m) log m), 
e uma implementação de sequência não-ordenada baseada em localizadores, que tem tempo de 
execução ON Hn Já que ambas as implementações seriam relativamente simples de codificar, elas 
são aproximadamente iguais em termos de sofisticação da programação requerida, Elas também 
são aproximadamente equivalentes em termos dos fatores constantes em seus tempos de exe- 
cução de pior caso. Olhando somente para esses tempos de execução de pior caso, prefere-se a 
implementação haseada em heap quando o número de arestas em um grafo for pequeno (ou seja, 
quando m = mi log n) e prefere-se a implementação com sequência quando o número de arestas 
for grande (ou seja, quando m > т у log n). 


Proposição 13.24 Dado um grafo simples náo-dirigido ponderado G com n vértices € m ares- 
tas tal que o peso de cada aresta seja ndo-negative e um vértice v de G, o algoritmo de Dijkstra 
determina a distância de va todos ox outros vértices de G em tempo (On + mj fog n) mo pior 
caso, ou altermativamente em tempo Ori) no pior case. 


No Exercicio R- 13.17 explora-se como modificar o algoritmo de Dijkstra para produzir uma 
árvore T com raiz em v tal que o cominho em T do vértice v a um vértice u seja o caminho mini- 
mo em C de v para м. 
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Programando o algoritmo de Dijkstra em Java 


Tendo fornecido o pseudocódigo do algoritmo de Dijkstra, apresenta-se o código em Java para 
o algoritmo de Dijkstra pressupondo que se tem um grafo náo-dirigido com pesos inteiros posi- 
tivos. Expressa-se o algoritmo através de uma classe Dijkstra (Trechos de código 13.15-13.16), 
que declara uma decoração peso рага cada aresta e para acessar o peso da aresta e. À classe 
Dijkstra assume que cada aresta tem uma decoração peso. 


ѓе Algoritmo de Dijkstra para o problema do menor caminho 
* am um grafo não dirigido cujas arestas têm pesos inteiros não negativos. */ 
public class Dijkstra--V, E> ( 
/** valor infinito. */ 
protected static final Integer INFINITE = Integer. MAX VALUE: 
/** Grafo de entrada. */ 
protected Graph-- V, E> graph; 
/** Decoração para pesos das arestas */ 
protected Object WEIGHT; 
/** Decoração para as distâncias dos vérticas */ 
protected Object DIST = new Objecti Y; 
/** Decoração para os elementos da fila de prioridades */ 
protected Object ENTRY = new Objectí ); 
/** Fila de prioridade auxiliar. */ 
protected AdaptablePriorityQueue-- Integer, Vertex V >> О; 
/** Executa o algoritmo de Dijkstra. 
* aparam g Grafo de Entrada 
* param s Vértice 
"aparam w Objeto peso */ 
public void execute(Graph-- V, E> q, Vertex « V- s, Object w) | 
graph — g; 
WEIGHT = w; 
DefauitComparator dc = new DefaultComparator( |; 
Q = new HeapAdaptablePriorityQueue-- Integer, Vertex V = midek 
dijkstraVisit(s); 
| 
/** Retorna a distância de um vértice a partir do vértice de origem. 
* Bparam u Vértice inicial da árvore do menor caminho */ 
public int getDistivertax-=V > u)[ 
i return (Integer) u.get{DIST]; 


Trecho de código 13.15 Classe Dijkstra implementando o algoritmo de Dijkstra. (continua no 
Trecho de código 13.16.) 


A maior tarefa no algoritmo de Dijkstra é realizada pelo método dijkstraVisit. É utilizada 
uma fila de prioridade Q suportando métodos baseados em localizadores (Seção 8.4.2). Inse- 
re-se um vértice ы em Q com o método insert, que retorna o localizador de u em Q. Associa-se 
a u seu localizador em Q através do método setEntry e recupera-se o localizador de ш através 
do método getEntry. Vide que associar localizadores aos vértices é uma aplicação do padrão 
de decoradores (Seção 13.3.2). Em vez de usar uma estrutura de dados adicional para os rótu- 
los D[u], explora-se o fato de que D[u] é a chave para o vértice n em Q e por isso D[u] pode 
ser acessado com o localizador de u em C. Mudar o rótulo de um vértice v para d no processo 
de relaxamento corresponde a chamar o método replaceKey(e.d), onde e € o localizador de z 
em 0, 
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/** A execução corrente do algoritmo de Dijkstra. 
* (param v vértice. 
+r 
protected void dijkstraVisit (Vertex V-- v) f 
і! armazena todos os vertices em urna fila de prioridades OQ 
Tor (Vertex -- V > u: graph.vertices( y) | 
int u dist; 
if (uz2v) 
u dist = 0; 
else 
u dist = INFINITE; 
Entry--Integer, Vertex <V == u entry = Q.insert(u dist, u}; // autoboxing 
u.putiEMTRY, u entry); 
} 
## Aumenta a nuvem, um vértice por vez 
while (1C isEmptyt }} { 
/ remove de O e insere na nuvem um vértice com distância minima 
Entry= Integer, Vertex<V>> u entry = Q.min( ); 
Vertex V-- и = u entry.getValue( |; 
intu dist = u entry. getKey |; 
Q.remove(u entry; — //remove u da fila de prioridade 
u.put(DIST,u dist); / a distância de u é final 
u.remove(EMTRY); {remove o elemento decoração de u 
if iu dist == INFINITE) 
continue; vértices inalcançáveis nào são processados 
if examina todos os vizinhos de u e atualiza suas distâncias 
for (Edge-- E> е: graph.incidentEdgesiu]) { 
Vertex: > z = graph.opposite(u,e); 
Entry <Integer, Vertex<=V>> z entry 
= (Entry «Integer, Vertex <V >>] z.getENTRY): 
if iz entry l= null) { 4 verifica que z está em О, isto ё, não está na nuvem. 
inte weight = (Integer) e.get( WEIGHT) 
intz dist = z entry.getKey( ); 
if (uj, dist + e weight < z dist) H relaxamento da aresta e = (uz) 
O.replaceKey(z_entry, u_dist + & weight); 
} 
| 
} 
} 


Trecho de código 13.16 Método dijkstra da classe Dijkstra. (Continuação do Trecho de código 
13.15.) 


13.7 Árvores de cobertura mínima 


Suponha que se deseja conectar todos os computadores em um prédio de escritórios usando a menor 
quantidade possível de cabos. Pode-se modelar este problema usando um grafo ponderado C cujos 
vértices representem os computadores e cujas arestas representem todos os possíveis pares (u,v) de 
computadores nos quais o peso (0,4) da aresta (ev) € igual ao comprimento dos cabos necessários 
para ligar os computadores u e v. Em vez de determinar um caminho mínimo a partir de um dado 
vértice v, está-se interessado em encontrar uma árvore (livre) F que contenha todos os vértices de Ge 
tenha o peso total mínimo, Os métodos para encontrar essas árvores são à foco desta seção. 
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Definição do problema 


Dado um grafo não-dirigido ponderado G, está-se interessado em encontrar uma árvore T que 
contenha todos os vértices de (; e minimize a soma 


w(T)= 2: wir). 
RE 

Uma árvore como esta, que contenha todos os vértices de um grafo conexo G, é chamada de 
ürvore de cobertura, e o problema de encontrar uma árvore de cobertura T com a menor soma de 
pesos é conhecido como o problema da drvore de cobertura mínima (MST). 

O desenvolvimento de algoritmos eficientes para o problema da árvore de cobertura mí- 
nima precede a noção moderna de uma ciência da computação. Nesta seção, serão discutidos 
dois algoritmos para resolver o problema da MST. Estes algoritmos são aplicações clássicas do 
método guloso, o qual, como foi analisado brevemente na seção anterior, se baseia em escolher 
objetos para unir a uma coleção crescente escolhendo iterativamente um objeto que minimiza 
uma dada função de custo. O primeiro algoritmo que será discutido é o algoritmo de Kruskal, 
que faz a MST “crescer” em grupos considerando as arestas na ordem dada por seus pesos, O 
segundo algoritmo que será analisado é o algoritmo de Prim-Jarnik, que faz a MST crescer a 
partir de um vértice raiz, de forma semelhante ao algoritmo de Dijkstra para determinação de 
caminhos mínimos. 

Como na Seção 13.6.1, para simplificar a desenção dos algoritmos, assume-se que o grafo 
de entrada G é nào-dirigido (ou seja, todas as suas arestas são não-dirigidas) e simples (ou seja, 
os vértices não são ligados a si mesmos e não a arestas paralelas). Assim, denotam-se as arestas 
de G como pares não-ordenados de vértices (uv). 

Antes de discutir os detalhes dos algoritmos, no entanto, examina-se um fato crucial sobre as 
árvores de cobertura mínima que formam a base dos algoritmos. 


Um fato crucial sobre árvores de cobertura minima 


Os dois algoritmos para MST que serão discutidos se baseiam no método guloso, que neste caso 
depende crucialmente do fato a seguir. (Ver Figura 13.17.) 


e pertence a uma árvore de cobertura mínima 


aresta de peso 
minimo faz a “ponte” 


Figura 13,17 Uma ilustração do fato crucial sobre árvores de cobertura minima. 
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( 
Figura 13.18 Exemplo da execução do algoritmo de Kruskal para MST em um 0c 
e b | 


grafo com 
a aresta sendo exami- 


Figura 13.19.) 


ção. (Continua na 
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(m) (n) 


Figura 13.20 Exemplo da execução do algoritmo de Kruskal para MST (continuação). A ares- 
ta considerada em (n) une os dois últimos grupos, o que conclui esta execução do algoritmo de 
Kruskal. (Continuação da Figura 13.19.) 


O tempo de execução do algoritmo de Kruskal 


Nesta seção, será analisado o tempo de execução do algoritmo de Kruskal. Denota-se com n e m 
o número de vértices e arestas do grafo G, respectivamente. Ássume-se que os pesos das arestas 
podem ser comparados em tempo constante. Por causa do alto nível da descrição fornecido para 
o algoritmo de Kruskal no Trecho de código 13.17, analisar seu tempo de execução requer que 
se tenha mais detalhes de sua implementação. Especificamente, deve-se indicar as estruturas de 
dados usadas e como elas são implementadas, 

Implementa-se a fila de prioridade Q com um heap. Assim, pode-se inicializar Q em tempo 
O(m log m) através de inserções repetidas, ou em tempo O(m) usando a construção bottom- 
up (ver Seção 8.3.6). Adicionalmente, а cada iteração do laço enquanto uma aresta de peso 
mínimo é removida em tempo Ot(log m), que é na realidade log n) pois G é simples. Desta 
forma, o tempo total gasto para a execução das operações da fila de prioridade não é mais que 
O(m log n). 

Pode-se representar cada grupo C usando as estruturas de dados de partição união-procura 
discutida na Seção 11.6.2. Esta estrutura baseada em seqúéncia permite executar uma série de N 
operações union e find no tempo ON log №), e a versão baseada em árvores pode implementar 
cada uma das séries de operações no tempo СКМ log” N). Assim, desde que executadas m — 1 
chamadas ao método union e no máximo m chamadas ao método find, o tempo total gasto na 
união dos grupos e para determinar os grupos que os vértices pertencem não é maior que Am 
log n) usando uma abordagem baseada em sequências ou O(m log* n) usando uma abordagem 
bascada em árvores. 

Então, usando argumentos similares a estes para o algoritmo de Dijkstra, conclui-se que o 
tempo de execução do algoritmo de Kruskal é O((n + rm) log n), que pode ser simplificado como 
Qim log n), desde que G seja simples e conexo. 


13.7.2 O Algoritmo Prim-Jarnik 


No algoritmo de Prim-Jarník, faz-se crescer uma árvore de cobertura mínima a partir de um 
único grupo iniciando com um vértice “raiz” v. A idéia principal é similar à do algoritmo de 
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Dijkstra. Inicia-se com um vértice v, definindo a “nuvem” inicial de vértices C. A cada itera- 
ção, escolhe-se uma aresta de peso minimo e = (v,u) conectando um vértice v da nuvem C a 
um vértice u fora de C. O vértice u é trazido para dentra da nuvem C e o processo se repete até 
que uma árvore de cobertura seja formada. De novo, o fato crucial sobre árvores de cobertura 
minima entra em ação, pois se sempre for escolhida a aresta de menor peso unindo um vértice 
de C com um vértice fora de C, teremos certeza de estar sempre adicionando uma aresta válida 
à MST. 

Para implementar eficientemente esta abordagem, pode-se usar outra idéia do algoritmo de 
Dijkstra, Mantém-se um rótulo D[u] para cada vértice u fora da nuvem C, armazenando o peso da 
melhor aresta atual unindo s à nuvem C. Estes rótulos nos permitem reduzir o número de arestas 
que é necessário analisar para decidir qual vértice deve ser unido à nuvem. O pscudocódigo é 
fornecido no Trecho de código 13.18. 


Algoritmo PrimJarnik (Cr): 
Entrada: um grafo simples, conexo e ponderado G com n vértices e m arestas. 
Saida: uma árvore de cobertura minima 7 para С 
Escolha qualquer vértice v de G 
Dv] = 0 
para cada vértice n + v faça 
Diu] = + 
Inicialize T «— E 
Inicialize uma fila de prioridade O com um iem (us null). Du) para cada vértice н onde 
(u,null) é o elemento e D[u] é à chave. 
enquanto () não está vazia faça 
(ue) «— Q.removeMini) 
Coloque o vértice u e a aresta e em T. 
para cada vértice z adjacente a u tal que z esteja em Q faça 
[Faga o relaxamento na aresta (10,73) 
se w(iu.zn = D[z] então 
Dz] wils. zh) 
Altere para {т\н} o elemento do vértice z em (QJ. 
Altere рага D[z] а chave do vértice z em 0. 
retorna a árvore 7 


Trecho de código 13.18 O algoritmo de Prim-Jarník para o problema da MST. 


Analisando o algoritmo Prim-Jarnik 


Sejam a em o número de vértices e arestas do grafo de entrada C. A implementação do algoritmo 
de Prim-Jamik tem detalhes similares ao algoritmo de Dijkstra. Implementando a fila de priori- 
dade Q como um heap que suporta os métodos baseados em localizadores (ver Seção 8.4.2), € 
possível extrair o vértice a à cada iteração em tempo (log n). Além disso, pode-se atualizar cada 
valor de Diz] em tempo log т), o que é feito no máximo uma vez para cada aresta (u, 2). Os 
outros passos de cada iteração podem ser implementados em tempo constante. Assim, o tempo 
de execução total do algoritmo é (Min + m) log n, que é Oem log m. 


llustrando o algoritmo Prim-Jarnik 


O algoritmo Prim-Jarnik é ilustrado nas Figuras 13.21 a 13.22, 
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(a) (b) 


te) (d) 


Figura 13.21 Uma ilustração do algoritmo MST Prim-Jamik. (Continua na Figura 13.22.) 


13.8 Exercicios 
Para obter o código fonte е auxilio com os exercícios, visite java.datastructures.net 


Reforço 


R-13.1 Desenhe um grafo simples não-dirigido G com 12 vértices, 18 arestas e 3 
componentes conexos. Por que seria impossível desenhar G com 3 compo- 
nentes conexos se G tivesse 66 arestas? 

R-13.2 Seja C um grafo simples conexo com п vértices e m arestas. Explique por 
que log m) é O(log n). 

R-13.3 Desenhe uma representação de lista de adjacências e uma de matriz de ad- 
jacéncia do grafo não-dirigido mostrado na Figura 13.1. 

R-13.4 Desenhe um grafo simples conexo e dirigido G com 8 vértices e 16 arestas 
de forma que o grau de entrada e de saída de cada vértice seja 2. Mos- 
tre que existe um único ciclo (não-simples) que inclui todas as arestas do 
grafo, ou seja, que você pode desenhar todas as arestas em suas direções 
respectivas sem levantar o lápis do papel (este tipo de ciclo é chamado de 
ciclo de Euler). 
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C-13.5 


C-13.6 


C-13.7 


C-13.8 


C-13,9 


C-13.10 


C-13.11 
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Suponha que se deseja representar um grato de n vértices usando uma 
lista de arestas, assumindo que os vértices com os inteiros do conjunto 
10, 1... n1] sejam identificados, Descreva como implementar o con- 
töiner E para suportar desempenho log a) para o método areAdjacent. 
Como vocé vai implementar o método neste caso? 
A Universidade Tamarindo e várias outras escolas ao redor do mundo estão 
envolvidas em um projeto multimídia. Uma rede de computadores é monta- 
da para conectar essas escolas usando linhas de comunicação que formam 
uma árvore livre. As escolas decidem instalar um servidor de arquivos em 
uma das escolas para compartilhar dados entre todas elas. Como o tempo 
de transmissão em uma conexão é dominado por sua inicialização € sin- 
cronização, o custo da transferência de dados é proporcional ao número de 
conexões usadas. Assim, é desejável escolher uma escola “central” para o 
servidor. Dada uma árvore livre 7 e um nodo v de T, a excentricidade de v 
é о comprimento do maior caminho de v a qualquer outro nodo de T. Um 
nodo de T com a menor excentricidade é chamado de centro de T. 
а. Projete um algoritmo eficiente que, dada uma árvore livre T com n mo- 
dos, determina seu centro. 
b. O centro é único? Se nào for, quantos centros diferentes uma árvore livre 
pode ter? 
Mostre que se Té uma árvore produzida por caminhamento em largura para 
um grafo conexo €, então, para cada vértice v no nivel i, o caminho de T 
entre se v tem i arestas, e qualquer outro caminho de G entre s e v tem pelo 
menos i arestas, 
O atraso em uma chamada de longa distância pode ser determinado multi- 
plicando-se uma pequena constante pelo número de conexões telefónicas 
entre os pontos sendo ligados. Suponha que a rede telefônica da compa- 
пша ЕТЕТ é uma árvore livre. Os engenheiros da RT&T desejam avaliar 
o maior atraso possível em uma chamada de longa distância. Dada uma 
árvore livre T, o diámetro de T é o comprimento do caminho mais longo 
entre dois nodos de 7. Forneça um algoritmo eficiente para determinar o 
diámetro de 7. 
Uma companhia chamada RT&T tem uma rede de n estações telefónicas 
conectadas por m linhas de alia velocidade. O telefone de cada cliente é co- 
nectado diretamente a uma estação em sua área. Os engenheiros da RT&T 
desenvolveram um protótipo de videofone que permite que dois clientes ve- 
Jam um ao outro durante uma chamada. Para ter uma imagem de qualidade 
acenável, no entanto, o número de conexões usado para transmitir os sinais 
de vídeo entre as partes não pode exceder 4. Suponha que a rede da RT&T 
é representada por um grafo. Planeje um algoritmo eficiente que determina, 
para cada estação, o conjunto de estações que podem ser alcançadas com 4 
conexóes ou Menos, 
Explique por que não existem arestas de descoberta lora da árvore produzi- 
da por um caminhamento em largura construído para um grafo dirigido. 
Um ciclo de Euler de um grafo dirigido G com n vértices e m arestas é um 
ciclo que passa por cada aresta de G exatamente uma vez de acordo com sua 
direção. Um ciclo deste tipo sempre existe se G for conexo e o grau de entra- 
da for igual ao grau de saída para cada vértice em бу. Descreva um algoritmo 
de tempo O(n + m) para achar um ciclo de Euler em um digrafo б. 
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Redes de computadores devem evitar pontos de falha, isto é nodos da 
rede que podem desconectar a rede se eles falharem. Diz-se que um grafo 
conexo é biconexo sc ele não contém vértices que removidos dividiam 
G em dois ou mais componentes conexos. Apresente um algoritmo que 
execute no tempo ín + m) para adicionar no máximo п arestas а um 
grafo conexo G com n = 3 vértices e m = n— 1 arestas, para garantir que 
É seja biconexo. 

A NASA deseja interligar m estações espalhadas nos Estados Unidos usan- 
do canais de comunicação. Cada par de estações tem uma capacidade de 
transmissão de mensagens diferente, que são conhecidas de antemão. А 
NASA deseja escolher n— 1 canais (6 mínimo possível) de tal forma que to- 
das as estações estejam ligadas pelos canais de transmissão e a capacidade 
de transmissão total seja máxima. Forneça um algoritmo eficiente para este 
problema e determine sua complexidade de pior caso, Considere o grafo 
ponderado G = (V, E) onde V é o conjunto de estações e E é o conjunto de 
canais entre as estações. Defina o peso wie) de uma aresta e € E como a 
capacidade de transmissão do canal correspondente. 

Suponha que você receba uma tabela de hordrios que consiste em: 


+ um conjunto À de n aeroportos, e para cada aeroporto a € A um tempo 
mínimo de conexão cla), 

* um conjunto F de m vôos e para cada vão PE + 

> um aeroporto de origem a (0 c A; 

um aeroporto de destino af) A; 

hora de saída r (fr, 

+ hora de chegada ff). 


O 8 


© 


A 


Descreva um algoritmo eficiente para o problema do escalonamento dos 
vôos. Neste problema, recebemos os aeroportos a e b, o tempo r e dese- 
jamos calcular a sequência de vãos que nos permite chegar o mais rápido 
possível em $ saindo de a no tempo t ou mais tarde. O tempo minimo de 
conexão nos aeroportos intermediários deve ser observado, Qual o tempo 
de execução de seu algoritmo em função de n e m? 

No interior do Castelo de Asymptopia existe um labirinto, e em cada passa- 
gem do labirinto há uma sacola de moedas de ouro, A quantidade de ouro 
em cada sacola varia. Você terá a oportunidade de caminhar no labirinto 
recolhendo sacolas, entrando pela porta marcada “Entrada” e saindo pela 
porta marcada “Saída” (são portas diferentes). Quando estiver no labirinto, 
você não poderá voltar em seu caminho. Cada corredor do labirinto tem 
uma seta pintada na parede, e você só poderá andar seguindo a direção das 
setas. Não existe maneira de fazer uma “volta” no labirinto. Dado um mapa 
do labirinto, incluindo as quantidades de ouro e as direções dos corredores, 
descreva um algoritmo para ajudá-lo a recolher o máximo de ouro, 

Seja G um digrafo ponderado com a vértices. Proponha uma variação do 
algoritmo de Floyd-Warshall para determinar os comprimentos dos cami- 
nhos minimos de cada vértice a cada outro vértice, Seu algoritmo deve ser 
executado em tempo Din’). 

Suponha que recebemos um grafo dirigido G com a vértices e seja M a 
matriz de adjacéncia n X n correspondente à C. 
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a. Seja o produto de M consigo mesma (M^) definido, para l = ij = п, 
como segue: 


M. (i, f) = M, DOMU, DD € M (I, M (n, jh 


onde “E” é o operador booleano or e “0” é o operador booleano and. 
Dada esta definição, o que é que Мп, $ = 1 informa sobre os vértices i 
ej? Ese M' (i, j) = 0? 

b. Suponha que M^ é o produto de М? consigo mesma. O que representam 
as entradas de M^? E as entradas de М? = (M'(M)? Em geral, que infor- 
mação está contida na matriz M? 

c. Suponha que é ponderado e assuma o seguinte: 

l. para l SiS m М, D = 0. 

2. paral = i, j 5 n, Mii, j) = wii, j) se {i j) ? E. 
3. paral = i, j € n, Mii, j) = c se {i,j} ? E. 
Também defina M^ para 1 = 1,j = n. como segue: 


M'(í, = min MG, + M(L) Min) + M (m |. 


Se Mi, Г) = k, o que se pode concluir sobre a relação entre os vértices 
jej? 


C-13.27 Um grafo G é bipartido se seus vértices podem ser divididos em dois 


C-13.28 


Projetos 
P-13.1 


P-13.2 


conjuntos 5 e Y sendo que toda aresta de G tem um vértice final em X e 
outro em F. Projete e analise um algoritmo eficiente para determinar se 
um grafo não-dirigido G é bipartido (sem ter o conhecimento dos conjun- 
tos X e Р), 
Um método MST antigo, chamado Algoritmo de Baruvka, trabalha sobre 
um grafo G com n vértices e m arestas com pesos distintos: 
Seja T um subgrafo de Cr inicialmente contendo somente os vértices de V. 
enquanto 7 tem menos que n— 1 arestas faça 
para cada componente conexo C, de T faça 
Procure a aresta com menor peso (v,u) de E com v C, eu C, 
Adicione (v.u) em T (a menos que ele já esteja em T). 
retorne T 
Argumente porque este algoritmo está correto e porque ele executa no tem- 
po Om log n). 
Seja G um grafo com n vértices e m arestas sendo que todos os pesos das 
arestas em Cr sejam inteiros no intervalo [1.1]. Apresente um algoritmo para 
procurar as árvores de cobertura mínimas de G no tempo CN mn log” n). 


Escreva uma classe implementando um TAD simplificado para grafos que 
têm os métodos relevantes para grafos não-dirigidos e que não inclui mé- 
todos de atualização, usando uma matriz de adjacência. Sua classe deve 
incluir um método construtor que recebe duas coleções (por exemplo, se- 
quências) — uma coleção V de vértices e uma coleção E de pares de vérti- 
ces — e produz o grafo G que estas duas coleções representam. 
Implemente o TAD simplificado descrito no Projeto P-13,1 usando uma 
lista de adjacências. 


P-13.3 


P-13.4 
P-13.5 


P-13.6 


P-13.7 
P-13.8 
P-13.9 


P-13.10 


P-13.11 
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Implemente o TAD simplificado descrito no Projeto P-13.1 usando uma 
lista de arestas. 


Estenda a classe do Projeto P-13,2 para suportar métodos de atualização. 


Estenda a classe do Projeto P-13.2 para suportar todos os métodos do TAD 
grafo (incluindo métodos para arestas dirigidas). 


Implemente um caminhamento em largura genérico usando o padrão de 
templates. 


Implemente o algoritmo de ordenação topológica. 

Implemente o algoritmo de Floyd-Warshall para o fechamento transitivo. 
Planeje uma comparação experimental de vários caminhamentos em pro- 
fundidade em relação ao algoritmo de Floyd-Warshall para determinar o 
fechamento transitivo de um digrafo. 

Implemente o algoritmo de Kruskal assumindo que os pesos das arestas 
sejam inteiros. 

Implemente o algoritmo de Prim-Jarnik assumindo que os pesos das arestas 
sejam inteiros, 

Realize uma comparação experimental de dois dos algoritmos para MST 
discutidos neste capítulo ( Kruskal e Prim-Jarnik). Desenvolva um conjunto 


de experimentos para testar os tempos de execução dos algoritmos usando 
grafos gerados aleatoriamente. 


Uma forma de construir um fabirinto inicial com uma matriz de a < ih 
sendo que cada célula da matriz é cercada por quatro paredes de tamanho 
único, Então removemos duas paredes de tamanho único para representar o 
inicio e o final. Para cada parede restante que não seja fronteira, definimos 
um valor randômico e criamos um grafo G, chamado de dual, sendo que 
cada célula seja um vértice em G e exista uma aresta ligando os vértices 
de duas células se e somente se as células compartilharem uma parede em 
comum. Construimos o labirinto pela procura de uma árvore de cobertura 
mínima T em O e removemos todas as paredes correspondentes as arestas 
de T. Escreva um programa que use este algoritmo para gerar labirintos e 
então solucione-os, De forma resumida, seu programa deverá desenhar o 
labirinto e, idealmente, ele deverá visualizar a solução do mesmo, 


Escreva um programa que crie as tabelas de roteamento para os nodos de 
uma rede de computadores, baseado na rota do menor caminho, onde a dis- 
tância é medida pelo contador de saltos, isto é, o número de aresta em um 
caminho. À entrada deste problema é a informação de conectividade para 
todos os nodos em uma rede, como no exemplo a seguir: 


241.12.31.14: 241.12.31.15 241.12.31.18 241.12.31.19 


que indica três nodos de rede que estão conectados a 241.13.31.14. isto é, 
três nodos que estão um salto adiante. À tabela de roteamento para o nodo 
no endereço A é o conjunto de pares (8,0), que indicam que para trans- 
ferir uma mensagem de A para B, o próximo nodo para enviar (no menor 
caminho entre A e B) é o C. Seu programa deverá ter como saída a tabela 
de roteamento para cada nodo em uma rede, dada como entrada a lista de 
conectividade de nodos, cada qual é a entrada com a sintaxe apresentada 
acima, uma por linha. 
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Observações sobre o capítulo 


O método de caminhamento em profundidade é parte do folclore da computação, mas Hoperoft 
e Tarjan [50, 90] foram aqueles que mostraram o quanto esse algoritmo é útil para resolver vá- 
rios problemas diferentes de grafos. Knuth [62] discute o problema da ordenação topológica. O 
algoritmo simples de tempo linear que foi descrito para determinar se um grafo dirigido é forte- 
mente conexo é de Kosaraju. O algoritmo de Floyd-Warshall é descrito em um artigo de Floyd 
[35]. e se baseia em um teorema de Warshall [98]. O método de coleta de lixo por marcação e 
varredura é um dos muitos algoritmos diferentes para coleta de lixo. Encoraja-se o leitor interes- 
sado no estudo da coleta de lixo a consultar o livro de Jones [55]. Para aprender sobre diferentes 
métodos para desenho de grafos veja o capítulo de Tamassia [88], a bibliografia comentada de 
Di Battista et al, [29] ou o livro de Di Battista er al. [30]. О primeiro algoritmo conhecido para 
a árvore de cobertura mínima é de Barüvka [9] e foi publicado em 1926. O algoritmo de Prim- 
Jarnik foi primeiro publicado em tcheco por Jarnik [54] em 1930 e em inglês em 1957 por Prim 
[82]. Kruskal publicou seu algoritmo para a árvore de cobertura mínima em 1956 [65]. O leitor 
interessado em mais estudo sobre o problema da árvore de cobertura mínima pode consultar o 
artigo de Graham e Hell [45]. O algoritmo assintoticamente mais rápido até o momento para a 
árvore de cobertura mínima é um método randomizado de Karger, Klein e Tarjan [56] que tem 
tempo esperado Om). 

Dijkstra [31] publicou seu algoritmo para caminho mínimo com origem ünica em 1959, O 
leitor interessado em um estudo mais profundo sobre grafos pode consultar os livros de Ahuja, 
Magnanti é Orlin [6], Cormen, Leiserson e Rivest [25], Even [33], Gibbons [39], Mehlhom [75], 
Tarjan [91] e o capítulo de van Leeuwen [94]. O tempo de execução para os algoritmos de Prim- 
Jarnik e de Dijkstra pode ser melhorado até tornar-se On login + my) implementando-se a fila 
de prioridade Q com uma de duas estruturas de dados mais sofisticadas, o “Fibonacci Heap” [37] 
ou o “Relaxed Heap” [32]. 
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14.1 


Gerenciamento de Memória 


Para implementar qualquer estrutura de dados em um computador real, precisa-se usar a memória 
do computador. Memória do computador é simplesmente uma sequências de palavras da me- 
mória. e cada qual consiste em 4, 8 ou 16 bytes (dependendo do computador). Estas palavras da 
memória são enumeradas de O a N— 1, onde N é o número de palavras de memória disponíveis no 
computador. O número associado com cada memória de computador é conhecido como endereço. 
Assim, à memória em um computador pode ser visualizada como basicamente um arranjo gigante 
de palavras de memória, Usando esta memória para construir estruturas de dados (e execução de 
programas) requer que se gerencie a memória do computador para prover o espaço necessário 
para os dados – incluindo variáveis, nodos, apontadores, arranjos e cadeia de caracteres ~ e para as 
programas executarem. O básico do gerenciamento de memória será discutido nesta seção. 


14.1.1 Pilhas na máquina virtual de Java 


Um programa Java é tipicamente compilado em uma sequência de códigos byte que são definidos 
como instruções de "máquina" para um modelo bem formado — a máquina virtual Java (JVM). 
A definição da JVM é o coração da definição da linguagem Java. Pela compilação do código Java 
no código de bytes da JVM, preferencialmente na linguagem de máquina de uma CPU especih- 
ca, um programa Java pode ser executado em qualquer computador, assim como um computador 
pessoal ou um servidor, que tem um programa que pode emular a JVM. De forma interessante, а 
estrutura de dados pilha tem um papel central na definição da JV M. 


A pilha de métodos Java 


Pilhas têm uma importante aplicação no ambiente de execução de programas Java. Uma exe- 
cução de programa Java (mais precisamente, uma execução de uma thread Java) tem uma pilha 
privada, chamada pilha de métodos Java, ou simplesmente pilha Java, que é usado para manter 
a trilha das variáveis locais e outras informações importantes dos métodos como eles são invoca- 
dos durante à execução. (Ver Figura 14,1.) 

Mais especificamente, durante a execução de um programa Java, a máquina virtual Java 
(JVM) mantém uma pilha cujos elementos são descritores das invocações dos métodos correntes 
(isto é, não-finalizadas). Estes descritores são chamados frames. Um frame para alguma invoca- 
ção de um método "fool" armazena os valores correntes das variáveis locais е os parâmetros do 
método fool, bem como as informações do método “cool” que chamou fool e o que necessita ser 
retornado pelo método “cool”, 


Mantendo a trilha do contador do programa 


А ТУМ mantém uma variável especial, chamada de contador do programa, para manter o ende- 
reço do comando que a JVM está executando no momento em um programa. Quando um método 
“cool” invoca outro método “fool”, o valor corrente do contador do programa é armazenado no 
frame da invocação corrente de cool (assim a JVM saberá onde retomar quando o método fool 
for finalizado). No topo da pilha Java está o frame do método de execução, isto é, o método que 
tem o controle da execução. Os elementos restantes da pilha são frames dos métodos suspensos, 
ou seja, métodos que tem invocado outro método e estão esperando para retornar o controle para 
suas finalizações. A ordem dos elementos na pilha correspondem à cadeia de invocações dos 
métodos atualmente ativos. Quando um novo método é invocado, um frame para este método é 
empilhado na pilha. Quando ele termina, seu frame é desempilhado e a JVM retoma o processa- 
mento do método anteriormente suspenso. 
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coollint j | 
int Ks; 
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Pilha Java 


Programa Java 


Figura 141 Um exemplo de uma pilha de métodos Java: método fool chamado pelo método 
cool que anteriormente foi invocado pelo método main. Observe os valores do contador do pro- 
grama, parâmetros e variáveis locais armazenadas na pilha de frames. Quando a invocação do 
método fool termina, a invocação do método cool será retomada na execução da instrução 217, 
que é obtida pelo incremento do valor do contador do programa armazenado na pilha de frames, 


Entendendo a passagem de parâmetros por valor 


A JVM usa a pilha Java para executar a passagem de parámetros nos métodos. Especificamente, 
Java usa o protocolo passagem por valor (call-by-value). Isso significa que o valor corrente de 
uma variável (ou expressão) é que é passado como um argumento para uma chamada de método. 

No caso de uma variável x de um tipo primitivo, como um int ou float, o valor corrente de x 
é simplesmente um número que é associado a x. Quando um valor é passado para a chamada do 
método, ele é assinalado para uma variável local no frame da chamada do método. (Esta simples 
atribuição também é ilustrada na Figura 14.1.) Se a chamada ao método altera o valor desta va- 
riável local, ela não alterará o valor da variável na chamada do método. 

Entretanto, no caso da uma variável x que refere a um objeto o valor corrente de x é o ende- 
reco de memória do objeto x. (Esse assunto será abordado mais profundamente na Seção 14.1.2.) 
Desta forma, quando o objeto x é passado como um parâmetro para algum método, o endereço de 
x é realmente passado. Quando este endereço é atribuido a alguma variável local y na chamada do 
método, y referenciará ao mesmo objeto que x se refere. 

Então, se a chamada ao método altera o estado interno do objeto que y se refere, ele simul- 
taneamente será alterado no objeto que x se refere (que é o mesmo objeto), Apesar disso, se a 
chamada do programa altera y para se referenciar a outro objeto, x continuará inalterado — ele 
continuará se referindo ao mesmo objeto que ele se referenciava anteriormente, 

Desta forma, a pilha de métodos Java é usado pela JVM para implementar chamadas aos 
métodos e passagem de parâmetros. Incidentalmente, pilhas de métodos não é uma característica 
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específica do Java. Elas são usadas os ambientes de execução das mais modernas linguagens de 
programação, incluindo С е C++. 


A pilha de operandos 


De forma interessante, existe realmente outro local onde a JVM usa uma pilha. Expressões aril- 
méticas, como (da + b) * (c + de, são avaliadas pela JVM usando uma pilha de operandos. 
Uma simples operação binária, como a + b, é computada pelo empilhamento de a, empilhamen- 
to de b e então a chamada a uma instrução que desempilha do topo dois itens, executa a operação 
binária sobre eles e empilha o resultado. Da mesma forma, instruções para escrever e ler elemen- 
tos na memória envolve o uso dos métodos pop e push para o operando pilha. Assim, а JVM usa 
uma pilha para avaliar expressões matemáticas em Java. 

Na Seção 7,3.6, foi descrito como avaliar uma expressão matemática usando um caminha- 
mento posfixado, que é exatamente o algoritmo que a JVM usa. Foi descrito que o algoritmo em 
uma forma recursiva não é uma forma explicita do uso do operando pilha, Todavia, esta descrição 
recursiva é equivalente a versão não-recursiva baseada no uso de um operando pilha. 


Implementando a recursão 


Um dos beneficios do uso de uma pilha para implementar a invocação de métodos é que ela 
permite que os programas utilizem recursáo. Isto é, ela permite que um método possa chamar 
а si mesmo, como discutido na Seção 3.5. De forma interessante, antigas linguagens de progra- 
mação, como Cobol e Fortran, originalmente não usavam pilhas de execução para implementar 
chamada a métodos e procedimentos. Porém, por causa da elegância e eficiência que a recursão 
permite, todas as linguagens de programação modernas, incluindo versões modernas de lingua- 
gens clássicas como Cobol e Fortran, utilizam uma pilha de execução para chamada a métodos 
e procedimentos. 

Na execução de um método recursivo, cada caixa de marca de recursáo corresponde a um 
frame da pilha de métodos Java, Também, o conteúdo da pilha de métodos Java corresponde a 
cadeia de caixas de uma invocação inicial de método a invocação corrente. 

"ara melhor ilustrar como uma pilha de execução permite métodos recursivos, considera-se 
uma implementação Java de uma definição clássica recursiva da função fatorial, 


sizin — ln — 2-1, 
como mostrado no Trecho de código 14.1. 


public static long factorialileng n) 1 


if in <= 1| 
return 1: 
else 


return n“factonalin— 1); 


Trecho de código 14.1 Método recursivo para o factorial. 


А primeira vez que se chama o método factorial, sua pilha se ajusta para incluir uma variá- 
vel local para armazenar o valor 4, O método factorial( ) chama recursivamente ele próprio para 
calcular (e — LY, que empilha um novo frame na pilha de execução Java. Um após o outro, estas 
chamadas recursivas calculam (n = 2)!. etc. A cadeia de invocações recursivas e desta forma a 
pilha de execução, somente cresce para o tamanho л, porque a chamada a factorial 1) retorna 
| imediatamente sem invocar ele próprio recursivamente, A pilha de execução permite que o 
método factorial!) exista simultaneamente em vários frames ativos (no máximo n vezes). Cada 
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frame armazena o valor do seu parámetro n bem como o valor retornado. Eventualmente, quando 
a primeira chamada recursiva termina, ela retorna (n — 1)!, que é então multiplicado por n para 
calcular n! da chamada original do método factorial. 


14.1.2 Alocando espaço na memória heap 


Tem-se realmente discutido (na Seção 14.1.1) como a máquina virtual Java aloca espaços variá- 
veis locais de métodos nos frames dos métodos na pilha de execução Java. Entretanto, a pilha 
Java não é somente o tipo de memória disponível para dados do programa em Java. 


Alocação de memória dinâmica 


Memória para um objeto pode também ser alocado dinamicamente durante uma execução de 
método, tendo o método utilizando um novo operador criado em Java, Por exemplo, a seguinte 
comando Java cria um arranjo de inteiros cujo tamanho é dado pelo valor da variável k: 


int[ ] items = new int[k]; 


O tamanho do arranjo acima é conhecido somente em tempo de execução. Além disso, o ar- 
ranjo pode continuar a existir mesmo depois do método que o criou terminar. Assim, a memória 
para este arranjo náo pode ser alocada na pilha Java, 


A memória heap 


Em vez de usar a pilha Java para este objeto, Java usa a memória de outra área de armazenamento 
— а memória heap (que nào deve ser confundida com a estrutura de dados "heap" apresentada no 
Capítulo 8). Essa e outras áreas de memória estão ilustradas em uma máquina virtual Java na Figu- 
ra 14.2. O espaço disponível na memória heap é dividido em blocos, que são “pedaços” contiguos 
de memória como arranjos que podem ter tamanho variável ou fixo. 

Para simplificar a discussão, assume-se que os blocos na memória heap são de tamanho fixo, 
por exemplo, 1.024 bytes, grandes o suficiente para comportar qualquer objeto que se queira 
eriar. (Eficientemente tratando o caso mais geral é realmente um problema de pesquisa interes- 
sante. ) 


Memória livre 


tamanho fixo = ndo aumenta cresce para uma menrória Maior cresce para шта menória menor 
Figura 14,2 Uma visão esquemática do leiaute dos endereços de memória na máquina virtual 
Java. 


Algoritmos de alocagáo de memória 


A definição da máquina virtual Java requer que a memória heap esteja disponível para alocar 
memória rapidamente para novos objetos, porém ela não especifica a estrutura de dados que se 
deve utilizar para fazer isto. Um método popular é manter “porções” contíguas de memória livre 
disponível em uma lista duplamente encadeada, chamada lista livre. As conexões que unem estas 
“porções” são armazenadas nas próprias porções, desde que sua memória não esteja sendo usada, 
À medida que a memória é alocada e desalocada, o conjunto de porções na lista é alterado, e a 
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memoria não utilizada é compartimentada em porções separadas por blocos de memória usada. 
Esta separação de memória não usada em porções separadas é conhecida como fragmentação. 
Claro que se gostaria de minimizar a fragmentação o máximo possível, 

Existem dois tipos de fragmentação que podem ocorrer. Fragmentação interna ocorre quan- 
do uma porção de um bloco de memória alocado não está realmente sendo usado. Por exemplo, 
um programa pode requisitar um arranjo de tamanho 1000, porém somente usa as primeiras 100 
posições deste arranjo, Não há muito que um ambiente de execução possa fazer para reduzir a 
fragmentação interna. Fragmentação externa, por outro lado, ocorre quando existe uma quanti- 
dade significante de memória não usada entre vários blocos contiguos de memória alocada, Desde 
que o ambiente de execução tenha o controle sobre onde alocar memória quando isto é requisitado 
(por exemplo, quando a palavra-chave new é usada em Java), o ambiente de execução deverá alo- 
car memora em uma forma que tente reduzir а fragmentação externa até que seja possível. 

Várias heurísticas têm sido sugeridas para alocação de memória em um heap de forma a 
minimizar a fragmentação externa. O algoritmo best-fit pesquisa toda a lista livre para procurar 
porções cujo tamanho é o mais próximo da quantidade de memória que está sendo requisitada. O 
algoritmo first-fit pesquisa desde o inicio da lista livre procurando a primeira porção que é gran- 
de o suficiente. O algoritmo next-fit € similar, pois também pesquisa a lista livre para buscar а 
primeira porção que é grande o suficiente, porém ele inicia sua pesquisa por onde encerrou ante- 
riormente, verificando a lista livre como uma lista encadeada circular (Seção 3.4.1). O algoritmo 
warst-fit pesquisa na lista livre para encontrar a maior porção disponível de memória, que pode 
ser feito mais rápido que uma pesquisa por toda a lista livre se esta lista fosse mantida como uma 
fila de prioridade (Capítulo 8), Em cada algoritmo, a quantidade requisitada de memória é sub- 
traida da porção de memória escolhida e a parte restante da porção é retornada para a lista livre. 

Amda que possa soar bem em um primeiro momento, o algoritmo besteht tende a produzir a 
pior fragmentação externa, desde que as partes restantes das porções escolhidas tendem a serém 
menores, O algoritmo first-fit é rápido, porém ele tende a produzir uma quantidade grande de 
[ragmentagäo externa no início da lista livre, que reduzirá a velocidade de pesquisas futuras. O 
algoritmo next-fit espalha a fragmentação de forma mais justa na memória heap, assim mantém 
os tempos de pesquisa baixos. Entretanto, este espalhamento também cria maior dificuldade de 
alocar grandes blocos O algoritmo worst-fil tenta evitar este problema mantendo seções conti- 
guas de memória livre o máximo possível. 


14.1.3 Coleta de lixo 


Em algumas linguagens, como C e C++, o espaço de memória para objetos pode ser explicita- 
mente desalojado pelo programador, que ё uma responsabilidade muitas vezes negligenciada por 
programadores iniciantes e é a fonte de erros frustrantes de programação até para programadores 
experientes. Em vez disso, os projetistas da linguagem Java colocaram a carga do gerenciamento 
de memória totalmente no ambiente de execução, 

Como mencionado anteriormente, a memória para objetos é alocada na memória heap e o 
espaço para as variáveis de instancia de um programa Java em execução são colocadas em suas 
pilhas de métodos, uma para cada processo de execução (para os programas simples discutidos 
neste livro existe Upicamente um processo executando). Visto que as vanáveis de instância em 
uma pilha de métodos podem se referir a objetos na memória heap, todas as variáveis e objetos 
na pulha de métodos do processo em execução são chamados objetos raízes. Todos estes objetos 
que podem ser alcançados seguindo as referências dos objetos que iniciam em um objeto raiz são 
chamados objetos vivos. Os objetos vivos são objetos ativos correntemente sendo usados pelo 
programa em execução, estes objetos ndo devem ser desalojados. Por exemplo, um programa Java 
em execução pode armazenar, em uma variável, uma referência para uma sequência $ que é imple- 
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mentada usando uma lista duplamente encadeada, A variável de referência para 5 é um objeto raiz, 
onde o objeto para 5 é um objeto vivo, como são todos os objetos nodos que são referenciados а 
partir deste objeto e todos os elemento que são referenciados a partir destes objetos nodos, 

De vez enquanto, a máquina virtual Java (VM) pode notificar que espaço disponível na me- 
mória heap está se tornando escasso. Em tempos similares, а ГУМ pode eleger para recuperar o 
espaço que está sendo usado por objetos que não viverão muito, e retorna a memória recuperada 
para a lista livre. Este processo de reparação é conhecido como coleta de lixo (garbage collec- 
tion). Existem diferentes algoritmos para a coleta de lixo, porém uma que é a mais utilizada & o 
algoritmo mark-sweep. 

No algoritmo de coleta de lixo mark-sweep, associa-se uma pequena "marca" com cada ob- 
jeto que identifica se este objeto está vivo ou não, Quando se determina, em algum ponto, que a 
coleta de lixo é necessária, suspendem-se todos os outros processos de execução e limpam-se as 
pequenas marcas de todos os objetos atualmente alocados na memória heap. Então se traga atra- 
vés da pilha Java dos processos atualmente em execução e marcam-se todos os objetos (raízes) 
nesta pilha como “vivos”, Deve-se então determinar todos os outros objetos vivos = aqueles que 
são alcançados a partir os objetos raízes. Para fazer isso eficientemente, pode-se usar a versão 
do grafo dirigido do caminhamento em profundidade (Seção 13.3.1). Neste caso, cada objeto na 
memória heap é visto como um vértice em um grafo dirigido e a referência de um objeto para 
outro é visto como uma aresta dirigida, Executando um caminhamento em profundidade para 
cada objeto raiz, pode-se corretamente identificar e marcar cada objeto vivo. Este processo é 
conhecido como fase “mark”. Uma vez este processo terminado, se vasculha a memória heap e 
recupera-se qualquer espaço que está sendo utilizado por um objeto que não tenha sido marcado. 
Neste ponto, pode-se, também, juntar todos os espaços alocados na memória heap em um sime 
ples bloco e, assim, eliminar a fragmentação externa, Este processo de rastreio e recuperação € 
conhecido como fase "sweep" e quando ele completa, pode-se retomar a execução dos processos 
suspensos. Assim, o algoritmo de coleta de lixo mark-sweep recuperará espaço não utilizado 
em um tempo proporcional ao número de objetos vivos e suas referências mais o tamanho da 
memória heap. 


Executando DFS in-place 


O algoritmo mark-sweep corretamente recupera espaço não utilizado na memória heap, porém 
existe um importante caso que se deve encarar durante a fase de marcação. Desde que se esteja re- 
cuperando espaço de memória em um tempo quando a memória disponível é escassa, deve-se сш- 
dar de não usar espaço extra durante a coleta de lixo. À confusão é que o algoritmo DES, na forma 
recursiva que se descreve na Seção 13.3.1, pode usar espaço proporcional ao número de vértices 
no grafo, No caso da coleta de lixo, os vértices no nosso grafo são os objetos na memória heap; 
então provavelmente não haverá muito desta memória para utilizar, Assim, nossa única alternativa 
é encontrar uma forma de executar o DFS in-place de preferência recursivamente, isto é, deve-se 
executar o DES usando somente uma quantidade constante de armazenamento adicional, 

A idéia principal para executar o DES in-place é simular a recursão na pilha usando as ares- 
tas do grafo (que no caso da coleta de lixo correspondem às referências aos objetos). Quando 
se percorre uma aresta a partir do vértice visitado v até um novo vértice w, alterna-se a aresta 
(vw) armazenada na lista de adjacéncia v para apontar para o pai de v na árvore DFS. Quando se 
retorna para v (simulando o retorno à partir de uma chamada “recursiva” em wh pode-se agora 
alterar a aresta que foi modificada para que aponte para w. Claro que é necessário ter alguma 
forma de identificar qual aresta se precisa alterar. Uma possibilidade é enumerar as referências 
iniciando em у como 1, 2, 3 e assim por diante, e armazenar, em adição a pequena marca (que 
se está usando para marcar como "visitado" na nossa DFS), um contador que fale quais arestas 
estão sendo modificadas, 
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Usar um contador requer uma palavra extra armazenada por objeto. Entretanto, esta palavra 
extra pode ser evitada em algumas implementações. Por exemplo, muitas implementações da 
máquina virtual Java representam um objeto como uma composição de uma referência com um 
identificador tipo (que indica se este objeto é um Integer ou de algum outro tipo) e como uma 
referência a outros objetos ou campos de dados para este objeto. Visto que a referência tipo é 
sempre assumida para ser o primeiro elemento da composição nestas implementações, pode-se 
usar esta referência para “marcar” a aresta que se altera quando se deixa o objeto v e se vai para 
algum objeto w. Simplifica-se a troca da referência em v que refere-se ao tipo de v com a referên- 
cia em v que refere-se a w. 

Quando se retorna a v, pode-se rapidamente identificar a aresta (v.w) que se altera, porque 
ela será à primeira referência na composição de v e a posição da referência para o tipo de v nos 
dirá o local onde esta aresta pertence na lista de adjacéncia de v. Assim, usando este truque de 
troca de arestas ou um contador, pode-se implementar DFS in-place sem afetar assintoticamente 
o tempo de execução. 


14.2 Memória externa e caching 


Existem várias aplicações de computador que precisam trabalhar com uma grande quantidade de 
dados. Exemplos incluem a análise de conjuntos de dados científicos, processamento de transa- 
cões financeiras e organização e manutenção de banco de dados (como uma lista telefônica). De 
fato, a quantidade de dados que devem ser gerenciadas é muitas vezes muito grande para encal- 
xá-la na memória interna do computador. 


14.2.1 A hierarquia de memória 


Para acomodar grandes conjuntos de dados, computadores têm uma hierarquia de diferentes 
tipos de memórias, que variam em termos de seus tamanhos e distâncias da CPU. Próximas da 
CPU são os registradores internos que a CPU utiliza. O acesso a estas memórias é muito rápido, 
porém existem relativamente poucas delas. Em um segundo nível na hierarquia está a memória 
cache. Esta memória é consideravelmente maior que o conjunto de registrador de uma CPU, po- 
rem acessá-la leva tempo (e podem existir algumas vezes múltiplas caches com tempos de acesso 
progressivamente lentos). Mo terceiro nivel na hierarquia está a memória inferna, que também 
é conhecida como memória principal ou core memory. À memória interna é consideravelmente 
maior que a memória cache, porém também requer mais tempo de acesso. Finalmente, no mais 
alto nível na hierarquia tem-se a memória externa, que usualmente consiste de discos, drivers de 
CDS, drives de DVD e/ou tapes, Esta memória é muito maior, porém ela também é muito lenta. 
Desta forma, a hierarquia de memória para computadores pode ser analisada como uma hierar- 
guia consistindo em quatro níveis, cada uma é maior e mais lenta que a apresentada no nível 
inferior. (Ver Figura 14.3.) 

Entretanto, em muitas aplicações somente dois níveis realmente importam — uma que pode 
agrupar todos os nens de dados e a nivel logo abaixo deste. Executar itens de dados de entrada 
e saída na memória mais alta que possa agropar todos os itens tipicamente, neste caso, será o 
gargalo computacional. 


Caches e discos 


Especificamente, os dois niveis que mais importam dependem do tamanho do problema que se está 
tentando resolver. Para um problema que pode ser todo encaixado na memória principal, os dois 
mais importantes níveis são a memória cache e a memória interna, O tempo de acesso na memória 
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Figura 14.3 А hierarquia de memóna. 


interna pode ser de 10 a 100 vezes maior que o acesso na memória cache. Por outro lado, para um 
problema que não se encaixa totalmente na memória principal os dois mais importantes níveis são 
a memória interna e memória externa. Aqui as diferenças são mais dramáticas para os tempos de 
acesso em discos, que usualmente tem a proposta geral de ser dispositivo de memória externa, são 
tipicamente de 100.000 a 1.000.000 vezes mais lenta que o acesso na memória interna. 

Para colocar este último citado em perspectiva, imagine existir um estudante em Baltimore 
que precisa enviar uma mensagem de cequisição de dinheiro para seus pais em Chicago. Se o 
estudante envia a seus pais um email, esta pode chegar ao computador da casa dos pais em se- 
gundos. Pense que este modo de comunicação corresponde a um acesso a memória interna pela 
CPU. Um modo de comunicação que corresponde a um acesso a memória externa que é 500.000 
vezes mais lenta seria o fato do estudante caminhar até Chicago e entregar sua mensagem pesso- 
almente, que levaria por volta de um més se ele caminhasse 20 milhas por dia na média. Assim, 
devem ser feitos poucos acessos à memória externa sempre que possível, 


14.2.2 Estratégias de cache 


Muitos algoritmos não são projetados com a hierarquia de memória em mente, apesar da grande 
anância entre os tempos de acesso para diferentes niveis. Sem dúvida, todas as análises de al- 
poritmos contidas neste livro, até o momento, tem assumido que todos os acessos а memória são 
iguais. Esta suposição pode parecer, em um primeiro momento, um grande equivoco — e um so- 
mente endereçado agora no capítulo final — porém existem boas razões do porque ela é realmente 
uma suposição razoável a ser feita. 

Uma justificativa para esta suposição é que ela muitas vezes é necessária para assumir que 
todo o acesso a memória leva a mesma quantidade de tempo, visto que especificar a informação 
dependente de dispositivo sobre tamanhos de memória é muitas vezes dificil de se conseguir. De 
fato, informações de tamanho de memória podem ser impossíveis de se conseguir. Por exem- 
plo, um programa Java que é projetado para executar em diferentes plataformas de computador 
não pode ser definido em termos de uma configuração de arquitetura específica de computador. 
Pode-se certamente usar informações específicas de arquitetura, quando se a tem (e será mostra- 
do como explorar esta informação neste capitulo). Porém, uma vez tendo otimizado o software 
para uma determinada configuração de arquitetura, o software não será mais independente de 
dispositivo, Felizmente, otimizações não são sempre necessárias, antes de qualquer coisa, por 
causa da segunda justificativa da suposição de tempos iguais ao acesso à memória. 


Caching e blocking 


Outra justificativa para a suposição de igualdade no acesso a memória é que projetistas de sis- 
temas operacionais têm desenvolvido mecanismos gerais que permitem que a maior parte do 
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acesso à memória seja rápida. Estes mecanismos são baseados em duas importantes propriedades 
de localização-da-referência que muitos software possuem: 


+ Localização temporal: Se um programa acessa uma certa localidade de memória, então 
ela provavelmente acessará este local novamente em um futuro próximo. Por exemplo, 
é bastante comum usar o valor de uma variável contadora em diferentes expressões, in- 
cluindo uma para incrementar o valor do contador. De fato, um provérbio comum entre 
arquitetos de computadores diz que “um programa gasta 90% do seu tempo em 10% do 
seu código”. 

* Localização espacial: Se um programa acessa um certo local de memória, então ele pro- 
vavelmente acessará outras localidades que estão próximas a ela. Por exemplo, um pro- 
grama usa um arranjo que provavelmente acessará as posições deste arranjo de uma forma 
sequencial ou próximo do sequencial. 


Cientistas e engenheiros de computador tem executado extensos experimentos para desenhar 
o perfil para justificar a afirmativa que muitos softwares possuem ambos os dois tipos de locali- 
zação-da-referência. Por exemplo, um laço “for” usado para rastrear um arranjo exibirá ambos 
os tipos de localidades. 

Localização temporal e espacial tem, um após o outro, causado dois fundamentais escolha 
de projeto para sistema de memória de computador em dois níveis (que são apresentador na in- 
terface entre memória cache е memória interna, e também na interface entre a memória interna 
c a memória externa). 

A primeira escolha de projeto é chamada de memória virtual. Este conceito consiste em 
prover um endereço grande como a capacidade da memória de nível secundário, e de transferir 
dados localizados na memória de nível secundário para o nível primário, quando os dados são 
endereçados. Memória virtual não limita o programador para a restrição do tamanho da memória 
interna. O conceito de trazer dados рага a memória primária é chamado de caching, e ela é moti- 
vada pela localização temporal. Trazendo dados para a memória primária, espera-se que ela será 
acessada novamente em um breve momento e se estará apto a responder rapidamente para todas 
as requisições para este dado que chega em um futuro próximo, 

A segunda escolha de projeto é motivada pela localidade espacial. Especificamente, se o 
dado armazenado em um local da memória de segundo nível | é acessada, então se leva para 
a memória de primeiro nível, um grande bloco de locais contiguos que incluem o local 1. (Ver 
Figura 14.4.) Este conceito é conhecido como blocking e € motivado pela expectativa que ou- 
tros locais próximos a | na memória de segundo nível de serem acessados. Na interface entre a 
memória cache e a memória interna, blocos são muitas vezes chamados de linhas de cache e 
na interface entre a memória interna e a memória externa, blocos são muitas vezes chamados 


de páginas. 


Um bloco em um disco 


Um bloco no espaço endereçado da memória externa 


__ A 


0123. 1024... HE … 


Figura 14.4 Blocos na memória externa, 
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Quando implementada com caching e clocking, a memória virtual muitas vezes permite 
perceber a memória de nível secundário como sendo mais rápida que ela realmente é. Entretanto, 
ainda existe um problema. Memória do nível primário € muito menor que a memória secundária. 
Além disso, por causa dos sistemas de memória usarem blocking, qualquer programa de subs- 
tância provavelmente alcançará um ponto onde ele requer dados da memória secundária, porém, 
a memória primária está realmente cheia de blocos. Para realizar a requisição e manter o uso do 
caching e blocking, deve-se remover alguns blocos da memória primária para “fazer sala” para 
um novo bloco advindo da memória secundária, neste caso. Decidir como fazer este despejo cria 
um número de estruturas de dados interessantes e consequentes projetos de algoritmos, 


Algoritmo de caching 


Existem várias aplicações Web que devem trabalhar com informações revisitadas apresentadas 
nas páginas Web. Estas revisitadas tem sido mostradas para exibir ambas as localidades de re- 
ferências — tempo e espaço. Para explorar estas localidades de referências, elas possuem várias 
vantagens para armazenar cópias de páginas Web na memória cache, assim estas páginas podem 
ser rapidamente recuperadas quando forem novamente requisitadas. Em particular, supondo que 
se lenha uma memória cache que tem rm “slots” que podem conter páginas Web. Assume-se que 
uma página Web pode ser inserida em qualquer slot da cache. Isto é conhecido como cache com- 
pletamente associativa. 

Como um navegador executa, ela requisita diferentes páginas Web. Cada vez que o nave- 
gador requisita uma página Web 1, o navegador determina (usando um teste rápido) se / está 
inalterado e atualmente contido na cache. Se / está contida na cache, então o navegador satisfaz 
a requisição utilizando a copia da cache. Entretanto, se / nào estiver na cache a página para / ё 
requisitada na Internet é transferida para a cache, Se um dos m slots da cache estiver disponível, 
então o navegador atribui / para os slots vazios, Porém, se todas as células m da cache estiverem 
ocupadas, então o computador deve verificar qual fot a página anteriomente vista para despejar 
antes de buscar / е liberar seu espaço. Claro que existem diferentes políticas que podem ser usi- 
das para determinar qual página será despejada. 


Algoritmos de substituição de páginas 


Algumas das políticas de substituição de páginas melhor conhecidas incluem as seguintes (ver 
Figura 14.5): 


e First-in, first-out (FIFO): Despeja a página que está na cache por mais tempo, isto é, à 
página que foi transferida para a cache no passado mais distante, 

e Least recently used (LRU): Despeja a pagina cuja última requisição ocorreu no passado 
mais distante, 


Adicionalmente, pode-se considerar uma simples e pura estratégia randômica: 
* Random: Escolhe uma página randomicamente para desalojar da cache. 


A estratégia Random é uma das políticas mais fáceis de implementar: requer somente um 
gerador de número randômico ou pseudo-randómico. O resultado elevado envolvido na imple- 
mentação desta política é uma quantidade de trabalho adicional de Oil} por página substituida. 
Além disso, não existe overhead para cada página requisitada, nào ser para determinar se uma 
página requisitada esta ou não na cache. Anda, esta política não cria esforço para levar vantagem 
de qualquer localização temporal ou espacial que uma navegação de usuário exige. 

A estratégia FIFO é muito simples de implementar, visto que ela somente requer uma fila ( 
para armazenar referências para às páginas na cache. Páginas são enfileiradas na ( quando clas são 
referenciadas por um navegador e então elas são colocadas na cache. Quando uma página precisa 
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Novo blogo Bloco antigo (escolhido randomicamente) 


Política Random: p 


Novo bio Bloco antigo (mais antigo) 


Política FIFO: 


tempo de inserção: B:D0am — 7:43am “Sam Film — 7:30am 10:100m — 8:45am 


Novo bloco © Bloco [cl {menos recentemente utilizada) 
Política LRU: Er Dia ' 


8: Е2ат 9:22am 6:50m Ё&:20шп 10Lam 9:50am 


última utilização: 7:25am 
Figura 14.5 Políticas de substituição de páginas Random, FIFO e LRU. 


ser desalojada, o computador simplesmente executa uma operação de desenfileirar em Q para de- 
terminar qual página será desalojada. Desta forma, esta política também requer um trabalho adicio- 
nal de O(1) por página substituída. Também, a política FIFO não causa a si próprio um overhead 
para as páginas requisitadas. Além disso, cla tenta pegar vantagem da localização temporal. 

A estratégia LRU tem um passo maior que a estratégia FIFO, a estratégia LRU pega expli- 
citamente a vantagem da localização temporal o máximo possível, sempre desalojando a página 
que foi menos usada recentemente, À partir de um ponto de vista da política, esta é uma excelente 
abordagem, porém ela é custosa do ponto de vista da implementação. Isto é, sua forma de otimi- 
zar a localização temporal e espacial é claramente custosa, Implementar a estratégia LRU requer 
o uso de fila de prioridade Q que suporta pesquisas por páginas existentes, por exemplo, usando 
ponteiros especiais ou “localizadores”. Se Q for implementado com armazenamento baseado em 
sequência ou lista encadeada, então o overhead para cada página requisitada e página substituída 
será CMI). Quando se insere uma página em @ ou se atualiza sua chave, a página é atribuída a 
chave mais alta de О e é inserida no final da lista, o que pode também ser feito no tempo Oil). 
Mesmo que a estratégia LEU tem overhead de tempo constante, usar a implementação acima, o 
fator constante envolvido, em termos do tempo adicional de overhead e o espaço extra para a fila 
de prioridade Q faz desta política menos atrativa a partir do ponto de vista prático. 

Visto que estas diferentes políticas de substituição de páginas têm diferentes trocas entre 
dificuldade de implementação e o grau no qual elas pegam as vantagens das localizações, é na- 
tural questionar por alguns tipos de análises comparativas destes métodos para ver qual deles é 
o melhor, se existir. 

A partir do ponto de visto do pior caso, as estratégias FIFO e LRU tem claramente compor- 
tamento competitivo não atrativo. Por exemplo, suponha que se tenha uma cache que contenha m 
páginas, e considere os métodos FIFO e LRU para executar a substituição das páginas para um 
programa que tem um laço que repetidamente requisita m + 1 páginas em uma ordem circular, 
Ambas as políticas FIFO е LRU executam muito mal na sequência de páginas requisitadas, por- 
que elas executam uma substituição em todas as requisições de páginas. Desta forma, do ponto 
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de vista do pior caso, estas políticas são quase sempre as piores possíveis = elas requerem uma 
substituição de página para toda a página requisitada, 

Entretanto, esta análise do pior caso é muito pouco pessimista por ela focar no comportamen- 
to de cada protocolo para uma sequência ruim de requisições de páginas. Uma análise ideal seria 
comparar estes métodos sobre todas as sequências possíveis de requisições de páginas, Claro que 
isso é impossível de fazer exaustivamente, porém existe um grande número de simulações expe- 
rimentais feitas em sequências de requisições de páginas derivadas de programas reais, Baseada 
nestas comparações experimentais, a estratégia LRU tem sido apresentada para ser usualmente 
superior a estratégia FIFO, que é usualmente melhor que a estratégia Random, 


14.3 Pesquisa externa e árvores-B 


Considere-se o problema de implementar um dicionário ordenado para uma grande coleção de 
itens que não cabem na memória principal. Visto que uma das principais aplicações de grandes 
dicionários é em sistemas de banco de dados, referenciam-se os blocos da memória secundária 
como bloco de discos. Da mesma forma, a transferência de blocos entre a memória secundária 
e a memória principal é chamada de transferência de disco. Lembrando que existe uma grande 
diferença de tempo entre os acessos à memória principal e os acessos a disco, o principal objetivo 
quando se mantém um dicionário em memória externa é minimizar o número de transferências de 
disco necessárias para executar uma operação de consulia ou de atualização. De fato, a diferença 
de velocidade entre o disco e a memória interna é tão grande que se prefere executar um número 
considerável de acessos à memória interna se eles permitirem evitar algumas transferências de 
disco. Será analisada, então, a performance de implementações de dicionário pela contagem do 
número de transferências de disco que cada uma requer para executar as operações-padrão de 
pesquisa e atualização. Esta contagem é referida como a complexidade de E/S dos algoritmos 
envolvidos, 


Alguns dicionários de memória externa ineficientes 


Considerem-se primeiramente simples implementações de dicionário que usam uma sequência 
para armazenar itens. Se a sequência for implementada como uma lista duplamente encadeada 
não-ordenada, isto é. um arquivo de log baseado em uma lista, então as inserções podem ser 
executadas com transferências O(1), mas remoções e pesquisas requerem п transferências no 
pior caso uma vez que cada ligação executada pode acessar um bloco diferente. Esse tempo de 
pesquisa pode ser melhorado para CM n/B) transferências (ver Exercício C- 14.1), onde B denota o 
número de nodos da lista que cabem em um bloco, mas ainda é uma performance pobre. Pode-se. 
em vez disso, implementar a sequência usando um vetor ordenado, isto é, uma tabela de pesqui- 
sa. Neste caso, uma pesquisa executa ilog, n) transferências, usando algoritmos de pesquisa 
binária, o que é uma pequena melhoria. Porém, esta solução requer @(n/B) transferências para 
implementar uma operação de inserção ou remoção no pior caso, no qual será preciso acessar to- 
dos os blocos que armazenam o arranjo para mover os elementos para cima ou para baixo. Dessa 
forma, as implementações baseadas em seqiléncias de um dicionário não são eficientes do ponto 
de vista da memória externa, 

Uma vez que essas implementações simples são ineficientes em termos de E/S, então talvez 
seja possível considerar as estratégias com tempo logarítmico usadas com as árvores binárias ba- 
lanceadas (como as árvores AVL ou as árvores vermelho-pretas) ou outras estruturas de pesquisa 
com tempo médio para atualização e pesquisa logarítmica, (tais como skip lists). Esses métodos 
armazenam os itens do dicionário nos nodos de uma árvore binária ou um gráfico (para skip lists). 
Normalmente, cada nodo acessado em uma consulta ou atualização em uma dessas estruturas se 
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encontra em um bloco diferente. Sendo assim, esses métodos normalmente requerem Oi lag, т) 
transferências para executar uma operação de consulta ou atualização. [sso é bastante bom. mas 
pode-se fazer melhor. Em particular, será descrito no restante desta seção como executar consultas 
e atualizações em um dicionário usando apenas Otlog, n). isto é Сор mlog 8 transferências. 


14.3.1 Árvores (a,b) 


Para reduzir a importância da diferença de performance entre acessos à memória interna e aces- 
sos à memória externa em pesquisas, pode-se representar nosso dicionário usando uma árvore 
de pesquisa genérica (Seção 10.4. 1). Esta abordagem leva a uma generalização da estrutura de 
dados árvore (2,41 em uma estrutura conhecida como árvore (a,b) 

Uma árvore (a.b) é uma árvore de pesquisa genérica tal que em cada nodo, entre os filhos a e 
b, são armazenados entre à — | eb — I itens, Os algoritmos de pesquisa, Inserção e remoção de 
elementos em uma árvore (a,b), são generalizações das operações comespondentes para árvores 
(2,4). A vantagem de generalizar árvores (2,4) em árvores (a,b) é que a classe de árvores genera- 
lizadas oferecem uma estrutura de pesquisa mats flexivel, na qual o tamanho dos nodos e o tempo 
de execução das várias operações sobre o dicionário depende dos parámetros a e b. Ajustando 
os parámetros a e hb adequadamente em colação ao tamanho dos blocos de disco, pode-se derivar 
uma estrutura de dados que obtém boa performance em memória externa. 


Definição de uma árvore (a,b) 


Uma drvore onde a € b são inteiros, tal que 2 = a = (b + 192, € uma árvore genérica T com as 

seguintes restrições adicionais: 

Propriedade do tamanho: cada nodo interno tem pelo menos a filhos, a menos que seja a raiz, 
e no máximo & filhos. 

Prapriedade de profundidade: todos os nodos externos têm a mesma profundidade. 

Proposição 14.1 A altura de uma drvore que armazena n itens é (ор silog bj e log m 

log a). 

Justificativa Seja Tuma árvore que armazena п elementos e seja ^ra altura de T. Justifica-se a 

proposição estabelecendo os seguintes limites para hr 

| n T1 


| 
-logíin-41)* 45 log —— +] 
logh ора 2 


Pelas propriedades do tamanho e da profundidade, o número n" de nodos externos de Té no 
A hl M й He 
mínimo ža e no máximo 5", Pela Proposição 10.7, n" = m + 1. Assim. 


hl _- - рй 
la ntkdzb. 
Tomando o logaritmo de base 2 para cada termo, obtém-se 


(й + loga + 1:logín + FE = Alog b. E 


Operações de pesquisa e atualização 


Deve-se lembrar que em uma árvore de pesquisa genérica 7, cada nodo v de T armazena uma es- 
trutura secundária Pv), que é também um dicionário (ver Seção 10.4.1). Se Pé uma árvore (a,b), 
então Dv) armazena no máximo À itens. Faça Abi denotar o tempo para executar uma pesquisa 
em um dicionário Div). O algoritmo de pesquisa em uma árvore (a,b) é exatamente igual ao de 
árvores de pesquisa genérica apresentado na Seção 10.4.1. Logo, pesquisar em uma árvore (a,b) 
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Figura 14.6 Uma árvore-B de ordem 6. 


Como foi mencionado antes, cada pesquisa ou atualização requer que se examine no mínimo 
CN D) nodos para cada nivel da árvore, Conseqúentemente, qualquer operação de pesquisa ou atuali- 
zação em uma árvore B requer apenas Otlog ул), isto €, log n/log b) transferências de disco, Por 
exemplo, uma operação de inserção percorre a árvore para baixo visando localizar o nodo no qual 
inserir um novo item. Se esta adição for implicar em um overflow do nodo (ter d + | filhos), então 
este nodo é dividido em dois nodos que terão | (d + 1y2 Jel d + 1y2 | filhos, respectivamente. Este 
processo é então repetido no nivel de cima e irá continuar por pelo menos iloga n) niveis. 

Da mesma forma, se uma operação de remoção resultar em um underflow de um nodo (com 
[ 4/2] = 1 filhos), então se moverão as referências de um nodo irmão com pelo menos [4/2] + 
1 filhos ou necessitaremos executar uma operação de fusão deste nodo com seu irmão (e repetir 
essa operação para seu pai). Da mesma forma que com a operação de inserção, isso irá continuar 
pela árvore B acima por pelo menos © Пор, n) níveis. O requisito de que cada nodo interno tenha 
pelo menos [4/2] filhos implica que cada bloco de disco usado para suportar uma árvore B esteja 
pelo menos cheio pela metade. Logo, se terá o seguinte: 


Proposição 14.2 Uma drvore B com n itens tem complexidade de ES O(log, n) para opera- 
ções de pesquisa ou atualização e usa O(n/B) blocos, onde В ё o tamanho de um Woro. 


14.4 Ordenando memória externa 


Em adição as estruturas de dados, como dicionários, que precisam ser implementados na memó- 
ria extema, existem vários algoritmos que também podem operar em conjuntos de entrada que 
são muito grandes para caberem na memória interna, Neste caso, o objetivo é resolver o proble- 
ma algorítmico usando alguns blocos para transferências, sempre que possível. O domínio mais 
clássico para algoritmos de memória externa é o problema da ordenação. 


Merge-sort genérico 


Uma eficiente forma de ordenar um conjunto 5 de n objetos na memória externa equivale em uma 
simples variação da familia do algoritmo de merge-sort para a memória externa. À idéia principal 
por trás desta variação é juntar várias listas ordenadas recursivamente num momento, e assim 
reduzir o número de níveis da recursão. Especificamente, uma descrição deste método merge- 
sort genérico é dividir $ em d subconjuntos $, $.. 5, de tamanhos aproximadamente iguais, 
recursivamente ordenar cada subconjunto 5, e então simultaneamente juntar todas as d listas 
ordenadas em uma representação ordenada S. Se é possível executar o processo de junção usando 
somente O(n/B) transferências em disco, então para valores grandes suficientes de п, o total do 
número de transferências executadas com este algoritmo satisfaz a seguinte recorrência: 


Ka) = тбл) + сл, 


Memória 583 


Para alguma constante с = 1. Pode-se parar a recursáo quando л = B, visto que é possível 
executar uma transferência simples de bloco neste ponto, pegando todos os objetos na memória 
interna e então ordenando o conjunto com um algoritmo eficiente de memória interna. Assim, o 
critério de parada para л) é 

a= | se WEB Zl. 
Isto implica em uma solução de forma fechada que Am) € Oiv Bilog (n/B)), que é 
Ot (n/Bogin/Bylog d). 


Assim, se é possível escolher d para ser AUWA), então o número de transferências no pior 
caso executado por este algoritmo de merge-sort genérico será muito baixo. Escolhe-se 


d = (1/2) M/B, 


O único aspecto para este algoritmo deixar de especificar é como executar o merge d-way 
usando somente O(n/RB) transferências de blocos. 


14.4.1 Merge genérico 


Executa-se o merge d-way para apresentar um “torneio”, Seja T uma árvore binária comple- 
ta com d nodos externos e mantém-se T totalmente na memória interna. Associa-se cada nodo 
externo i de T com uma diferente lista ordenada 5, Inicializa-se T lendo cada nodo externo i, o 
primeiro objeto de 5,. Isso tem o efeito de ler de uma memória interna o primeiro bloco de cada 
lista ordenada 5, Para cada nodo pai interno v de dois nodos externos, então se comparam os 
objetos armazenados nos filhos de v e se associa o menor dos dois com v. Repete-se este teste de 
comparação no próximo nível acima de T e o próximo, e assim por diante. Quando se alcança a 
raiz r de T, se associará o menor objeto entre todos os da lista com r. Isto completa a inicialização 
para o merge d-way. (Ver Figura 14.7) 


3p 39| 42 бз 354 65 


— = — er 


3 46 5 


17 18 29/35 48 51 59) T2 78 88 


Figura 14.7 Um merge d-way. Mostramos um merge 5-way com В = 4. 


Em um passo geral do merge d-way move-se o objeto o associado com a raiz r de T em um 
arranjo que se está criando para a lista unida 5". Então segue-se T para baixo seguindo o caminho 
do nodo externo i em que o surge. Depois, lê-se em i o próximo objeto na lista 5, Se o não era o 
último elemento neste bloco, então o próximo objeto está na memória interna. De outra forma, 
lê-se no próximo bloco de 5, para acessar este novo objeto (se 5, agora não está vazio, associa-se 
o nodo i com um pseudo-objeto com chave +50). Então repetem-se as computações mínimas 
para cada nodo interno a partir de i até a raiz de T. Este novamente entrega-nos a árvore completa 
T. Então repete-se este processo movendo o objeto a partir da raiz de T para a lista unida 5', e 
reconstrói-se T, até que T esteja sem objetos. Cada passo na junção leva o tempo de O(log d); 
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então, o tempo interno para o merge d- wav é Oin log dh. O número de transferências executadas 
em um merger é OB), desde que se vasculhe cada lista $, uma vez, e se copie a lista juntada 
uma vez, Assim tem-se: 


Proposição 14.3 Dada uma sequência boscada em arraánjo 5 de n elementos armazenados na 
memnáória externa, pode-se ordenar N usando COUE og B Vlog MARII transferências e o tempo 
interno de CPU de Gta log nh onde Mé o tamanho da memória interna e B é o tamanho de um 


bloco, 


14.5 Exercicios 


Para obter o código fonte e auxilio com os exercicios, visite java.datastructures.net 


Reforço 
R-14,1 


R-14.2 
R-14.3 
K-14,4 


R-14.5 


R-14.6 


R-14.7 


K-14.8 


R-14.9 


Descreva em detalhes os algoritmos de inserção e remoção para uma árvore 
Lobi). 

Suponha que T é uma árvore genérica cujos nodos internos têm pelo menos 
5 e no máximo $ filhos, Рага quais valores de a c b T é uma árvore válida? 
Yara quais valores de d a árvore T do exercício anterior corresponde a uma 
árvore B de ordem d? 

Mostre os níveis de recursão da execução de um merge sort tipo four-way 
da segiiéncia apresentada no exercício anterior. 

Considere uma memória cache inicialmente vazia de 4 páginas, Quantas 
páginas faltam para o algoritmo LRU executar em si próprio na seguinte 
sequência de requisições: (2.4.1,2,5,1.3,5,4.1.2,3)? 

Considere uma memoria cache inicialmente vazia de 4 páginas. Quantas 
páginas faltam para o algoritmo FIFO executar em si próprio na seguinte 
sequência de requisições: (2,4,1,2,5,1,3,5,4,1,2,3)? 

Considere uma memörla cache inicialmente vazia de 4 páginas. Quantas 
páginas faltam para o algoritmo Random executar em si próprio na seguinte 
sequência de requisições: [2,4,/1,2,5,1,3,5,4,1,2,3)? Mostre todas as esco- 
lhas randómicas que o seu algoritmo cria neste caso. 

Desenhe o resultado da inserção, em uma árvore-B inicialmente vazia de 
ordem 7. elementos com chaves (4,40,23,50,11,34,62,78,66.22,90,59,25,7 
22,64,77,39, 12), nesta ordem. 

Mostre os niveis de recursão da execução de um merge sort tipo four-way 
da sequência apresentada no exercício anterior, 


Criatividade 


C-14.] 


Mostre como implementar um dicionário em memória externa usando uma 
sequência não-ordenada de forma que as atualizações requeiram apenas 
CMT transferências e que as atualizagóes requeiram ar) transferências, 
no pior caso, onde mn é o número de elementos e B é o número de nodos da 
lista que cabem em um bloco de disco. 


C-14.3 


C-14.4 


C-14.5 


C-14.6 
C-14.7 


C-14.8 


C-14.9 


C-14.10 
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Altere ás regras que definem árvores vermelho-pretas de forma que cada 
árvore vermelho-preta T tenha uma árvore (4,8) correspondente e vice- 
versa, 


Descreva uma versão modificada do algoritmo de inserção para árvores B 
de forma que, cada vez que se gera um overflow em virtude da divisão de 
um nodo v, redistribui-se chaves entre todos os irmãos de v de forma que 
cada irmáo armazene, aproximadamente, o mesmo número de chaves (pos- 
sivelmente propagando a divisão para o par de i). Qual a fração mínima de 
cada bloco que sempre será preenchida usando este esquema? 

Outra possibilidade de implementação de dicionários usando memória ex- 
tema é usar uma skip list para organizar em blocos individuais grupos de 
CME) nodos de qualquer nivel па skip list. Em especial, define-se uma skip 
list B de ordem d para representar uma estrutura de skip list, na qual cada 
bloco contém no mínimo | d/2 | nodos da lista e no máximo d nodos da lista. 
Será escolhido também, neste caso, d para ser o número máximo de nodos 
da lista de um nível da lista de saltos que cabe em um bloco. Descreva como 
é possível modificar os algoritmos de inserção e remoção em uma skip list 
para uma skip list B de maneira que a altura esperada para a estrutura seja 
Dilog mlog 8). 


Descreva uma estrutura de dados de memória externa para implementar 
um TAD fila em que o número total de transferências de disco necessárias 
para processar uma sequência de n operações de enfileirar e desenfileirar é 
MB). 

Resolva o problema anterior para um TAD deque. 

Descreva como usar uma ärvore-B para implementar o TAD partição 
(uniüo-procura) (da Seção 11.6.2) em que as operações union e find usam 
no máximo O(log log B? transferências de discos cada uma. 


Suponha que se tem uma sequência 5 de n elementos com chaves inteiras 
em que alguns itens em 5 são coloridos de "azul" e alguns de “vermelho”. 
Além disso, diga que um elemento vermelho e é par de um elemento azul 
fse eles tiverem o mesmo valor de chave, Descreva um algoritmo de me- 
mória externa eficiente para encontrar todos os pares azul e vermelho de 5. 
Quantas transferências de disco este algoritmo irá executar? 


Considere o problema de caching de página onde a memória cache pode ter 
m páginas, e se envia uma sequência P de n requisições de um pool de m + 
| páginas possíveis. Descreva a estratégia mais eficiente para o algoritmo 
offline € mostre que isto causa no máximo m + n/m perdas de páginas по 
total, iniciando de uma cache vazia. 


Considere à estratégia de caching de páginas baseada na regra Menos Fre- 
qüentemente Usada (LRU) onde a página na cache que tem sido acessada 
menos vezes é a que será desalojada quando uma nova página for requisi- 
tada. Se existirem amarrações, LFU desalojará a página menos fregüente- 
mente usada que tem estado na cache por mais tempo. Mostre que existe 
uma sequência P de n requisições que faz com que LRU fracassa (M1) 
vezes para um cache de m páginas, enquanto que o algoritmo mais eficiente 
fracassará (him) vezes. 


Hidden page 


Hidden page 


Hidden page 


Hidden page 


Hidden page 
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Uma forma elegante de lidar com eventos é em termos de variáveis aleatórias. Intuitivamen- 
te, as varmáveis aleatórias são variáveis cujos valores dependem do resultado de algum experi- 
mento, Formalmente, uma varidvel aleatória é uma função X que mapeia resultados de um espa- 
go amostral 5 a números reais, Uma veridvel aleatória indicadora é uma variável aleatória que 
mapeia resultados para os valores do conjunto (0, 1}. Frequentemente, na análise de estruturas 
de dados e algoritmos usa-se uma variável aleatória X para caracterizar o tempo de execução de 
um algoritmo randomizado, Nesse caso, 0 espaço amostral 5 é definido por todos os resultados 
aleatórios possíveis usados no algoritmo. 

Está-se mais interessado no valor típico, médio ou “esperado” de uma vanável aleatória, O 
valor esperado de uma variável aleatória X é definido como 


E(X)- Y x Pr(X = x) 


onde a soma é definida sobre todos os valores em X (que neste caso é assumido como discreta). 
Proposição A.18 (linearidade do valor esperado) Sejam X e Y duas varidveis aleatorias ar- 
birras. Então 

EX + Y) = EEND and — E(cX) = chA). 
Exemplo A.20 Seja X uma varidvel aleatória que associa o resultado do lançamento de dois 
dados à soma dos valores resultantes. Endo E(X) = 7. 


Justificativa Para justificar a afirmação, sejam X, e X, variáveis aleatórias correspondendo ao 
número resultante em cada dado. Assim, X, = X, (isto é, são duas instâncias da mesma função), 
e EIN = EIN, + Хуу = EX, + ELK) Cada resultado do lançamento dos dados ocorre com 
probabilidade 1/6. Portanto 


I 2 
E(X,)==+=4 
6 6 


para é = 1,2. Por isso, E(X) = 7. и 

Duas variáveis X e Y são independentes se 

PriX = xlr = y) = {Ж mx), 
para todos os números x e y. 
Proposição A.21 Se duas variáveis aleatórias X e Y ado independentes, então 
EUMM = E(X ME Y). 
Exemplo A.22 Seja X uma varidvel aleatória relacionando o resultado do lançamento de dois 
dados do produto dos valores resultantes. Entdo E(X) = 49/4, 
Justificativa Sejam X, e X, variáveis aleatórias correspondendo ao número resultante em cada 
dado. As variáveis X, e X, são claramente independentes, portanto 
E(X) = E(X Xp = E(X MEIA) = (12 = 49/4. = 

Os seguintes limites e resultados são conhecidos como limites Chernaff. 

Proposição A.23 Seja X a soma de um número finito de varidveis randómicas independentes 


WI e seja y > О o valor esperado de X. Entdo, para à > 0), 


Ё 
х8) PA |... 
Pri [ + | «aes 
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Técnicas matemáticas uteis 

Para comparar a medida de crescimento das diferentes funções, às vezes € útil aplicar a seguinte 
régra: 

Proposição A.24 (regra de L'Hópital)  Tendo-se lim, firm) = +oc e tendo-se lim, |, gla) = 
+, entáo lim, … Angie) = lim, … l'inVg' (nk onde Fla) e g'(n) denotam respectivamente 
as derivadas de fim) e de gm). 


Para derivar um limite superior e inferior para uma soma, é frequentemente útil separar uma 
soma como a seguir: 
n d " 
у= УО у, fü. 
ml fal de [+1 
Outra técnica útil é imitar a soma por uma integral. Se f é uma função não-decrescente, 
então, assumindo que os termos a seguir estejam definidos, 


[ foda o = F food. 


Existe uma forma geral de relação de recorrência que surge na análise de algoritmos de di- 
visão e conquista: 
Пл) = afinib) + Да), 
para constantes a = | е с>], 


Proposição A.25 Seja Tin) definida como acima. Entlo 


1. Sefin) é O) para alguma constante € > 0, então Tín) é Bin, 


2, Se fin) é &(n"*** log” m) para algum inteiro não-negativo k = O então, Tin) é 
Ala” log m). 

3. Se fin) é fin у para alguma constante € > 0 e se a fib) = cAn) então, 
Tin) é E). 


Esta proposição é conhecida como o métado mestre para caracterizar assintoticamente rela- 
ções de recorrência obtidas a partir de algoritmos de divisão e conquista. 
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„í "s 
p Estruturas de dados fundamentais s 
à em um framework consistente orientado a objetos “À 


^ Revisado poro refletir as inovoções do Java 5.0, a quarta edição de Estruturas de 

Dados e Algoritmos em Java de Goodrich e Tamassia continua a oferecer uma visão 

acessivel das estruturos de dados fundamentais usando um framework consistente 

23 orientado a objetos. Os autores fornecem a visão intuitiva, a descrição e a análise 

“a dos estruturas de dados e algoritmos fundamentais. Ilustrações, animações na Web 
e onálises matemáticos simplificadas justificam importantes conceitos analíticos. 


.  Caracteristicas-chave da quarta edição: 


. = Atualizado para o Java 5.0, inclui novos seções sobre genéricos e outros recursos do. 
@ do Java 5.0, trechos de código revisados, exemplos e estudos de caso 


Ф Centenas de exercícios que estimulam a criatividade e auxiliam o leitor a aprender 
a pensar como um programador, além de reforçar conceitos importantes Г 


> Novos estudos de caso demonstram tópicos como navegadores web, jogos de 
tabuleiro e encriptação 


Ф Um capitulo novo cobre arranjos, listas encadeadas e recursão 


Ф Um capitulo adicional sobre memória cobre gerenciamento de memória e estruturas 
de dados e algoritmos para memória secundário 


+ Exemplos de código em Java são usados de forma intensiva 


Ф Recursos adcionais (em inglés), como códigos fonte e animações, estão disponíveis 
na web 


Ф Material de apoio exclusivo para professores 
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